[go: up one dir, main page]

CN114967677B - 一种非线性集群系统的时变编队跟踪优化控制方法及系统 - Google Patents

一种非线性集群系统的时变编队跟踪优化控制方法及系统 Download PDF

Info

Publication number
CN114967677B
CN114967677B CN202210396494.4A CN202210396494A CN114967677B CN 114967677 B CN114967677 B CN 114967677B CN 202210396494 A CN202210396494 A CN 202210396494A CN 114967677 B CN114967677 B CN 114967677B
Authority
CN
China
Prior art keywords
follower
neural network
tracking error
gradient
control protocol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210396494.4A
Other languages
English (en)
Other versions
CN114967677A (zh
Inventor
董希旺
王婷婷
化永朝
于江龙
任章
李清东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202210396494.4A priority Critical patent/CN114967677B/zh
Publication of CN114967677A publication Critical patent/CN114967677A/zh
Application granted granted Critical
Publication of CN114967677B publication Critical patent/CN114967677B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0276Control of position or course in two dimensions specially adapted to land vehicles using signals provided by a source external to the vehicle
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明涉及一种非线性集群系统的时变编队跟踪优化控制方法及系统,包括:根据局部编队跟踪误差和集群系统动力学模型,得到跟踪误差模型;根据每个跟随者的局部编队跟踪误差得到每个跟随者的能耗性能指标;将每个跟随者的局部编队跟踪误差模型和能耗性能指标带入至HJB方程得到性能指标关于局部编队跟踪误差的梯度和最优控制协议;根据梯度、局部编队跟踪误差、跟随者未知动力学和非合作者领导者未知动力学得到梯度对应的平衡量;由神经网络辨识得到平衡量、跟随者和非合作者领导者未知动力学的神经网络逼近函数并结合到跟随者的最优控制协议中得到执行控制协议,实现未知动力学跟随者和非合作者领导者的非线性集群系统时变编队跟踪优化控制。

Description

一种非线性集群系统的时变编队跟踪优化控制方法及系统
技术领域
本发明涉及集群系统时变编队跟踪优化控制领域,特别是涉及一种适用于具有未知动力学和非合作领导者的非线性集群系统的实用时变编队跟踪优化控制方法及系统。
背景技术
由于集群系统编队控制在诸如协同监视、源搜索、移动目标包围等许多领域的广泛应用而成为了研究热点。集群系统编队控制包括无领导编队控制和有领导编队控制,其中无领导编队控制是指智能体通过与邻居之间的交互实现预定义的编队形状。在有领导编队控制中,跟随者除了构成期望的编队形状外,整个编队还应该跟踪由领导者产生的状态轨迹。
最优控制在许多实际控制系统中起着重要的作用,它通过最小化性能指标来实现控制目标,达到性能和能源的平衡。一般来说,最优控制协议是通过求解HJB方程得到。集群系统由于存在状态耦合问题,其最优控制在控制协议设计和稳定性分析上都比单系统控制更加复杂和具有挑战性。目前关于优化编队控制的研究主要集中在时不变编队和已知动力学方面,对于具有未知动力学和非合作领导者的非线性集群系统的时变编队跟踪优化控制仍然是一个有待解决的问题。
发明内容
本发明的目的是提供一种非线性集群系统的时变编队跟踪优化控制方法及系统,能够对具有未知动力学和非合作领导者的非线性集群系统的时变编队跟踪优化控制。
为实现上述目的,本发明提供了如下方案:
一种非线性集群系统的时变编队跟踪优化控制方法,包括:
建立集群系统通信网络拓扑模型;
根据所述集群系统通信网络拓扑模型建立集群系统未知动力学模型;
定义每个跟随者的相对于邻居的局部编队跟踪误差,根据所述局部编队跟踪误差和所述集群系统动力学模型,得到局部编队跟踪误差模型;
根据每个所述跟随者的所述局部编队跟踪误差得到每个所述跟随者的能耗性能指标;所述能耗性能指标为包括所述局部编队跟踪误差和跟随者控制协议的性能指标;
将每个所述跟随者的所述局部编队跟踪误差模型和所述能耗性能指标带入至HJB方程得到所述局部编队跟踪误差的梯度和最优控制协议;
根据所述梯度、所述局部编队跟踪误差、跟随者未知动力学和非合作者领导者未知动力学得到所述梯度对应的平衡量;
利用神经网络辨识所述梯度对应的平衡量、集群系统中跟随者和非合作者领导者未知动力学,得到平衡量神经网络逼近函数、跟随者未知动力学神经网络逼近函数和非合作者领导者未知动力学神经网络逼近函数;
在每个所述跟随者的最优控制协议中结合所述平衡量神经网络逼近函数、跟随者未知动力学神经网络逼近函数和非合作者领导者未知动力学神经网络逼近函数,得到执行控制协议;
根据所述执行控制协议和所述执行控制协议中各权重系数的更新律对各所述跟随者进行优化控制。
一种非线性集群系统的时变编队跟踪优化控制系统,包括:
集群系统通信网络拓扑模型建立模块,用于建立集群系统通信网络拓扑模型;
集群系统未知动力学模型建立模块,用于根据所述集群系统通信网络拓扑模型建立集群系统未知动力学模型;
跟踪误差模型建立模块,用于定义每个跟随者的相对于邻居的局部编队跟踪误差,根据所述局部编队跟踪误差和所述集群系统动力学模型,得到局部编队跟踪误差模型;
能耗性能指标获取模块,用于根据每个所述跟随者的所述局部编队跟踪误差得到每个所述跟随者的能耗性能指标;所述能耗性能指标为包括所述局部编队跟踪误差和跟随者控制协议的性能指标;
梯度和最优控制协议获取模块,用于将每个所述跟随者的所述局部编队跟踪误差模型和所述能耗性能指标带入至HJB方程得到所述局部编队跟踪误差的梯度和最优控制协议;
平衡量获取模块,用于根据所述梯度、所述局部编队跟踪误差、跟随者未知动力学和非合作者领导者未知动力学得到所述梯度对应的平衡量;
神经网络辨识模块,用于利用神经网络辨识所述梯度对应的平衡量、集群系统中跟随者和非合作者领导者的未知动力学,得到平衡量神经网络逼近函数、跟随者未知动力学神经网络逼近函数和非合作者领导者未知动力学神经网络逼近函数;
执行控制协议获取模块,用于在每个所述跟随者的最优控制协议中结合所述平衡量神经网络逼近函数、跟随者未知动力学神经网络逼近函数和非合作者领导者未知动力学神经网络逼近函数,得到执行控制协议;
优化控制模块,用于根据所述执行控制协议和所述执行控制协议中各权重系数的更新律对各所述跟随者进行优化控制。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供一种非线性集群系统的时变编队跟踪优化控制方法及系统,包括:建立集群系统未知动力学模型;根据局部编队跟踪误差和集群系统动力学模型,得到跟踪误差模型;根据每个跟随者的局部编队跟踪误差得到每个跟随者的能耗性能指标;将每个跟随者的局部编队跟踪误差模型和能耗性能指标带入至HJB方程得到局部编队跟踪误差的梯度和最优控制协议;根据梯度、局部编队跟踪误差、跟随者未知动力学和非合作者领导者未知动力学得到梯度对应的平衡量;利用神经网络辨识所述梯度对应的平衡量、集群系统中跟随者和非合作者领导者的未知动力学,得到平衡量神经网络逼近函数、跟随者未知动力学神经网络逼近函数和非合作者领导者未知动力学神经网络逼近函数并结合到每个跟随者的最优控制协议中得到执行控制协议;根据执行控制协议和执行控制协议中各权重系数的更新律对各跟随者进行优化控制。本发明研究了实用优化时变编队跟踪问题,其中时变编队跟踪误差可以任意小,可以解决非线性集群系统求解HJB方程的困难,自适应辨识的控制协议可以处理跟随者和非合作者领导者的未知动力学,最终能够提高跟踪优化控制的精准度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1提供的一种非线性集群系统的时变编队跟踪优化控制方法流程图;
图2为本发明实施例1提供的跟随者和非合作者领导者在不同时刻的状态图;
图3为本发明实施例1提供的跟随者的编队跟踪误差变化曲线;
图4为本发明实施例1提供的集群系统的代价函数变化曲线;
图5为本发明实施例2提供的一种非线性集群系统的时变编队跟踪优化控制系统框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出了一种适用于非线性集群系统的实用优化时变编队跟踪控制方法。一般来说,非线性系统的HJB方程求解困难,甚至无法保证获得解析解。对于集群系统,由于状态耦合问题,求解方法更具挑战性。在本发明中,使用辨识-评价-执行架构的强化学习解决了这些问题。此外,未知动力学由集成到控制器中的神经网络近似。最后,仿真结果说明了本发明的有效性。
本发明的目的是提供一种非线性集群系统的时变编队跟踪优化控制方法及系统,能够对具有未知动力学和非合作领导者的非线性集群系统的时变编队跟踪优化控制。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例1
如图1所示,本实施例提供一种非线性集群系统的时变编队跟踪优化控制方法,包括:
步骤S1:建立集群系统通信网络拓扑模型;
考虑包含N个跟随者和一个非合作者领导者的集群系统。跟随者之间通信拓扑由无向图描述,其中表示节点集合,为边集合,为邻接矩阵。如果从节点vj到节点vi之间存在信息流,那么(vi,vj)∈ε。当(vi,vj)∈ε时,对应的aij=1,否则aij=0。由于图G是无向的,所以aij=aji。非合作者领导者和跟随者之间的通信用bi表示,如果跟随者i能够收到非合作者领导者的信息,则bi=1,否则bi=0。假设非合作者领导者为根节点,至少有一个跟随者与非合作者领导者通信。
步骤S2:根据所述集群系统通信网络拓扑模型建立集群系统未知动力学模型;
所述集群系统未知动力学模型包括跟随者未知动力学模型和非合作者领导者未知动力学模型;
其中,所述跟随者未知动力学模型表达式为:
其中,为第i个跟随者的状态,为第i个跟随者的未知动力学函数;为第i个跟随者的控制协议;
fi(·)+ui(t)满足Lipschitz条件使得跟随者未知动力学模型对于有界初始状态具有唯一解。跟随者未知动力学模型满足可镇定性,即存在连续控制输入ui(t),i∈{1,2,...N}使得系统渐近稳定。
所述非合作者领导者未知动力学模型表达式为:
其中,为非合作者领导者的状态;为非合作者领导者的未知动力学函数。
步骤S3:定义每个跟随者的相对于邻居的局部编队跟踪误差,根据所述局部编队跟踪误差和所述集群系统未知动力学模型,得到跟踪误差模型;
由集群系统未知动力学模型中的状态信息定义实用时变编队跟踪优化控制。
跟随者构成的期望时变编队队形由向量描述,其中为相对于非合作者领导者的分段连续可微的偏移向量。
假设1:期望时变编队队形hi(t)有界,满足||hi(t)||≤υ,其中υ为正常数。
定义1:集群系统中跟随者未知动力学模型和非合作者领导者未知动力学模型在满足下列条件的前提下实现了实用时变编队跟踪;
i:所有跟随者的状态有界;
ii:对于任意有界状态xi(0),存在ε0>0使得成立,其中ε0称为实用时变编队跟踪误差界。
定义每个所述跟随者的相对于邻居的局部编队跟踪误差ei(t)
其中,aij表示第i个跟随者和第j个跟随者之间信息流的状态;bi表示非合作者领导者和第i个跟随者之间的通信状态;为第j个跟随者的状态;为相对于非合作者领导者的分段连续可微的偏移向量;N表示跟随者的数量;Ni表示第i个跟随者的邻居集合;
结合集群系统中跟随者未知动力学模型和非合作者领导者未知动力学模型得到所述跟踪误差模型的表达式为:
其中,
步骤S4:根据每个所述跟随者的所述局部编队跟踪误差得到每个所述跟随者的能耗性能指标;所述能耗性能指标为包括所述局部编队跟踪误差和跟随者控制协议的性能指标;
利用编队跟踪误差定义集群系统跟随者未知动力学模型和非合作者领导者未知动力学模型整体的性能指标;
其中r(e(t),u(t))=eTe+uTu,
则每个跟随者的性能指标
其中整体的性能指标可进一步写成
步骤S5:将每个所述跟随者的所述局部编队跟踪误差模型和所述能耗性能指标带入至HJB方程得到性能指标关于局部编队跟踪误差的梯度和最优控制协议;
本发明主要研究基于神经网络的强化学习方法设计最优协议实现对集群系统中跟随者和非合作者领导者未知动力学的实用最优时变编队跟踪以及最小化性能指标。
最小化性能指标表达式为:
根据最优性原理,将步骤3中的编队跟踪误差导数(局部编队跟踪误差模型)以及能耗性能指标代入HJB方程;
所述HJB方程为:
其中,为J* i(ei)关于ei的梯度;J* i(ei)为最小化的能耗性能指标;
为了实现编队跟踪,梯度包含有跟踪误差,跟随者及非合作者领导者的未知动力学,定义所述梯度的表达式为:
令静态条件得出最优控制协议表达式为:
其中,γi为设计常量,γi>2。
步骤S6:根据所述梯度、所述局部编队跟踪误差、跟随者未知动力学和非合作者领导者未知动力学得到所述梯度对应的平衡量;
对所述梯度的表达式进行变形得到所述梯度对应的平衡量表达式为:
步骤S7:利用神经网络辨识所述梯度对应的平衡量、集群系统中跟随者和非合作者领导者的未知动力学,得到平衡量神经网络逼近函数、跟随者未知动力学神经网络逼近函数和非合作者领导者未知动力学神经网络逼近函数;
所述平衡量神经网络逼近函数的表达式为:
所述跟随者未知动力学神经网络逼近函数的表达式为:
所述非合作者领导者未知动力学神经网络逼近函数的表达式为:
其中,分别是平衡量、跟随者和非合作者领导者的神经网络权重矩阵;Sfi(xi),Sf0(x0)以及Si(ei)为高斯函数。
步骤S8:在每个所述跟随者的最优控制协议中结合所述平衡量神经网络逼近函数、跟随者未知动力学神经网络逼近函数和非合作者领导者未知动力学神经网络逼近函数,得到执行控制协议;
所述执行控制协议为:
其中,为神经网络权重矩阵;
所述执行控制协议中各权重系数的更新律为:
其中,Γi,Ξ0为正定矩阵。σi为设计正常数,ρ0为设计负常数;κci>0为设计常量;κai>0为设计常量; 为利用神经网络辨识梯度后得到的梯度神经网络逼近函数中的权重矩阵。
利用神经网络辨识梯度后得到的梯度神经网络逼近函数,将在梯度的表达式中引入梯度神经网络逼近函数、跟随者未知动力学神经网络逼近函数和非合作者领导者未知动力学神经网络逼近函数得到梯度评价协议表达式为:
其中,的更新律设计为
步骤S9:根据所述执行控制协议和所述执行控制协议中各权重系数的更新律对各所述跟随者进行优化控制。
本实施例中,研究了实用优化时变编队跟踪问题,其中时变编队跟踪误差可以任意小。使用辨识(神经网络辨识)-评价(梯度评价协议)-执行(执行控制协议)架构的强化学习算法设计的实用优化编队跟踪控制协议可以解决非线性集群系统求解HJB方程的困难。设计包含自适应辨识的控制协议用于处理未知动力学以及非合作者领导者。
下面通过一个数值仿真例子来说明所提出理论的有效性。考虑具有一个非合作者领导者和四个跟随者的三阶非线性集群系统。非合作者领导者和追随者的模型为
其中αi=1,2,3,4=-0.7,0.1,-0.5,0.1,βi=1,2,3,4=0.5,0.4,-5.5,-11.5。初始位置x0(0)=[0,0,0]T,xi=1,2,3,4(0)=[4,5,2]T,[-5,-2,3]T,[5,-3,1]T,[4,-5,8]T
期望的编队队形为
图2为个体在不同时刻的状态快照,非合作者领导者用星号表示,跟随者用三角形、五角星、正方形和菱形表示。从图3可以看出,编队跟踪误差可以控制在较小范围内。代价函数变化如图4所示,反映了性能指标的优化情况。仿真结果进一步表明,该发明能够实现非线性集群系统的时变编队跟踪优化。
实施例2
如图5所示,本实施提供一种一种非线性集群系统的时变编队跟踪优化控制系统,包括:
集群系统通信网络拓扑模型建立模块M1,用于建立集群系统通信网络拓扑模型;
集群系统未知动力学模型建立模块M2,用于根据所述集群系统通信网络拓扑模型建立集群系统未知动力学模型;
跟踪误差模型建立模块M3,用于定义每个跟随者的相对于邻居的局部编队跟踪误差,根据所述局部编队跟踪误差和所述集群系统动力学模型,得到局部编队跟踪误差模型;
能耗性能指标获取模块M4,用于根据每个所述跟随者的所述局部编队跟踪误差得到每个所述跟随者的能耗性能指标;所述能耗性能指标为包括所述局部编队跟踪误差和跟随者控制协议的性能指标;
梯度和最优控制协议获取模块M5,用于将每个所述跟随者的所述局部编队跟踪误差模型和所述能耗性能指标带入至HJB方程得到性能指标关于局部编队跟踪误差的梯度和最优控制协议;
平衡量获取模块M6,用于根据所述梯度、所述局部编队跟踪误差、跟随者未知动力学和非合作者领导者未知动力学得到所述梯度对应的平衡量;
神经网络辨识模块M7,用于利用神经网络辨识所述梯度对应的平衡量、集群系统中跟随者和非合作者领导者的未知动力学,得到平衡量神经网络逼近函数、跟随者未知动力学神经网络逼近函数和非合作者领导者未知动力学神经网络逼近函数;
执行控制协议获取模块M8,用于在每个所述跟随者的最优控制协议中结合所述平衡量神经网络逼近函数、跟随者未知动力学神经网络逼近函数和非合作者领导者未知动力学神经网络逼近函数,得到执行控制协议;
优化控制模块M9,用于根据所述执行控制协议和所述执行控制协议中各权重系数的更新律对各所述跟随者进行优化控制。
对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (2)

1.一种非线性集群系统的时变编队跟踪优化控制方法,其特征在于,包括:
建立集群系统通信网络拓扑模型;其中,所述集群系统未知动力学模型包括跟随者未知动力学模型和非合作者领导者未知动力学模型;
所述跟随者未知动力学模型表达式为:
其中,为第i个跟随者的状态,为第i个跟随者的未知动力学函数;为第i个跟随者的控制协议;
所述非合作者领导者未知动力学模型表达式为:
其中,为非合作者领导者的状态;为非合作者领导者的未知动力学函数;
根据所述集群系统通信网络拓扑模型建立集群系统未知动力学模型;
定义每个跟随者的相对于邻居的局部编队跟踪误差,根据所述局部编队跟踪误差和所述集群系统未知动力学模型,得到局部编队跟踪误差模型;其中,每个所述跟随者的相对于邻居的局部编队跟踪误差的定义表达式为:
其中,aij表示第i个跟随者和第j个跟随者之间信息流的状态;bi表示非合作者领导者和第i个跟随者之间的通信状态;为第j个跟随者的状态;为相对于非合作者领导者的分段连续可微的偏移向量;N表示跟随者的数量;Ni表示第i个跟随者的邻居集合;
所述跟踪误差模型的表达式为:
其中,
根据每个所述跟随者的所述局部编队跟踪误差得到每个所述跟随者的能耗性能指标;所述能耗性能指标为包括所述局部编队跟踪误差和跟随者控制协议的性能指标;所述能耗性能指标的表达式为:
其中,
将每个所述跟随者的所述局部编队跟踪误差模型和所述能耗性能指标带入至HJB方程得到性能指标关于局部编队跟踪误差的梯度和最优控制协议;其中,所述将每个所述跟随者的所述局部编队跟踪误差模型和所述能耗性能指标带入至HJB方程得到性能指标关于局部编队跟踪误差的梯度和最优控制协议,具体包括:
所述HJB方程为:
其中,为J* i(ei)关于ei的梯度;J* i(ei)为最小化的能耗性能指标;
定义所述梯度的表达式为:
得出最优控制协议表达式为:
其中,γi为设计常量,γi>2;
根据所述梯度、所述局部编队跟踪误差、跟随者未知动力学和非合作者领导者未知动力学得到所述梯度对应的平衡量;其中,根据所述梯度、所述局部编队跟踪误差、跟随者未知动力学和非合作者领导者未知动力学得到所述梯度对应的平衡量,具体包括:
对所述梯度的表达式进行变形得到所述梯度对应的平衡量表达式为:
利用神经网络辨识所述梯度对应的平衡量、集群系统中跟随者和非合作者领导者未知动力学,得到平衡量神经网络逼近函数、跟随者未知动力学神经网络逼近函数和非合作者领导者未知动力学神经网络逼近函数;
其中,所述平衡量神经网络逼近函数的表达式为:
所述跟随者未知动力学神经网络逼近函数的表达式为:
所述非合作者领导者未知动力学神经网络逼近函数的表达式为:
其中,分别是平衡量、跟随者和非合作者领导者的神经网络权重矩阵;Sfi(xi),Sf0(x0)以及Si(ei)为高斯函数;
在每个所述跟随者的最优控制协议中结合所述平衡量神经网络逼近函数、跟随者未知动力学神经网络逼近函数和非合作者领导者未知动力学神经网络逼近函数,得到执行控制协议;
其中,所述执行控制协议为:
其中,为神经网络权重矩阵;
根据所述执行控制协议和所述执行控制协议中各权重系数的更新律对各所述跟随者进行优化控制;
所述执行控制协议中各权重系数的更新律为:
其中,Γi,Ξ0为正定矩阵;σi为设计正常数,ρ0为设计负常数;κci>0为设计常量;κai>0为设计常量; 为利用神经网络辨识梯度后得到的梯度神经网络逼近函数中的权重矩阵。
2.一种基于权利要求1所述的方法的系统,其特征在于,包括:
集群系统通信网络拓扑模型建立模块,用于建立集群系统通信网络拓扑模型;
其中,所述集群系统未知动力学模型包括跟随者未知动力学模型和非合作者领导者未知动力学模型;
所述跟随者未知动力学模型表达式为:
其中,为第i个跟随者的状态,为第i个跟随者的未知动力学函数;为第i个跟随者的控制协议;
所述非合作者领导者未知动力学模型表达式为:
其中,为非合作者领导者的状态;为非合作者领导者的未知动力学函数;
集群系统未知动力学模型建立模块,用于根据所述集群系统通信网络拓扑模型建立集群系统未知动力学模型;
跟踪误差模型建立模块,用于定义每个跟随者的相对于邻居的局部编队跟踪误差,根据所述局部编队跟踪误差和所述集群系统动力学模型,得到局部编队跟踪误差模型;
其中,每个所述跟随者的相对于邻居的局部编队跟踪误差的定义表达式为:
其中,aij表示第i个跟随者和第j个跟随者之间信息流的状态;bi表示非合作者领导者和第i个跟随者之间的通信状态;为第j个跟随者的状态;为相对于非合作者领导者的分段连续可微的偏移向量;N表示跟随者的数量;Ni表示第i个跟随者的邻居集合;
所述跟踪误差模型的表达式为:
其中,
能耗性能指标获取模块,用于根据每个所述跟随者的所述局部编队跟踪误差得到每个所述跟随者的能耗性能指标;所述能耗性能指标为包括所述局部编队跟踪误差和跟随者控制协议的性能指标;
所述能耗性能指标的表达式为:
其中,
梯度和最优控制协议获取模块,用于将每个所述跟随者的所述局部编队跟踪误差模型和所述能耗性能指标带入至HJB方程得到性能指标关于局部编队跟踪误差的梯度和最优控制协议;
其中,所述将每个所述跟随者的所述局部编队跟踪误差模型和所述能耗性能指标带入至HJB方程得到性能指标关于局部编队跟踪误差的梯度和最优控制协议,具体包括:
所述HJB方程为:
其中,为J* i(ei)关于ei的梯度;J* i(ei)为最小化的能耗性能指标;
定义所述梯度的表达式为:
得出最优控制协议表达式为:
其中,γi为设计常量,γi>2;
平衡量获取模块,用于根据所述梯度、所述局部编队跟踪误差、跟随者未知动力学和非合作者领导者未知动力学得到所述梯度对应的平衡量;
其中,根据所述梯度、所述局部编队跟踪误差、跟随者未知动力学和非合作者领导者未知动力学得到所述梯度对应的平衡量,具体包括:
对所述梯度的表达式进行变形得到所述梯度对应的平衡量表达式为:
神经网络辨识模块,用于利用神经网络辨识所述梯度对应的平衡量、集群系统中跟随者和非合作者领导者的未知动力学,得到平衡量神经网络逼近函数、跟随者未知动力学神经网络逼近函数和非合作者领导者未知动力学神经网络逼近函数;
其中,所述平衡量神经网络逼近函数的表达式为:
所述跟随者未知动力学神经网络逼近函数的表达式为:
所述非合作者领导者未知动力学神经网络逼近函数的表达式为:
其中,分别是平衡量、跟随者和非合作者领导者的神经网络权重矩阵;Sfi(xi),Sf0(x0)以及Si(ei)为高斯函数;
执行控制协议获取模块,用于在每个所述跟随者的最优控制协议中结合所述平衡量神经网络逼近函数、跟随者未知动力学神经网络逼近函数和非合作者领导者未知动力学神经网络逼近函数,得到执行控制协议;
其中,所述执行控制协议为:
其中,为神经网络权重矩阵;
优化控制模块,用于根据所述执行控制协议和所述执行控制协议中各权重系数的更新律对各所述跟随者进行优化控制;
其中,所述执行控制协议中各权重系数的更新律为:
其中,Γi,Ξ0为正定矩阵;σi为设计正常数,ρ0为设计负常数;κci>0为设计常量;κai>0为设计常量; 为利用神经网络辨识梯度后得到的梯度神经网络逼近函数中的权重矩阵。
CN202210396494.4A 2022-04-15 2022-04-15 一种非线性集群系统的时变编队跟踪优化控制方法及系统 Active CN114967677B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210396494.4A CN114967677B (zh) 2022-04-15 2022-04-15 一种非线性集群系统的时变编队跟踪优化控制方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210396494.4A CN114967677B (zh) 2022-04-15 2022-04-15 一种非线性集群系统的时变编队跟踪优化控制方法及系统

Publications (2)

Publication Number Publication Date
CN114967677A CN114967677A (zh) 2022-08-30
CN114967677B true CN114967677B (zh) 2024-07-19

Family

ID=82977949

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210396494.4A Active CN114967677B (zh) 2022-04-15 2022-04-15 一种非线性集群系统的时变编队跟踪优化控制方法及系统

Country Status (1)

Country Link
CN (1) CN114967677B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110488606A (zh) * 2019-07-25 2019-11-22 中北大学 一种多四旋翼主从式保性能神经自适应协同编队控制方法
CN111435252A (zh) * 2020-01-15 2020-07-21 北京航空航天大学 异构多智能体系统分组输出时变编队跟踪控制方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3732292B2 (ja) * 1996-11-27 2006-01-05 本田技研工業株式会社 車群走行制御システム
CN112000108B (zh) * 2020-09-08 2021-09-21 北京航空航天大学 一种多智能体集群分组时变编队跟踪控制方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110488606A (zh) * 2019-07-25 2019-11-22 中北大学 一种多四旋翼主从式保性能神经自适应协同编队控制方法
CN111435252A (zh) * 2020-01-15 2020-07-21 北京航空航天大学 异构多智能体系统分组输出时变编队跟踪控制方法及系统

Also Published As

Publication number Publication date
CN114967677A (zh) 2022-08-30

Similar Documents

Publication Publication Date Title
CN108803349B (zh) 非线性多智能体系统的最优一致性控制方法及系统
CN112947084B (zh) 一种基于强化学习的模型未知多智能体一致性控制方法
Li et al. Event-triggered asynchronous intermittent communication strategy for synchronization in complex dynamical networks
Li et al. Fuzzy approximation-based global pinning synchronization control of uncertain complex dynamical networks
CN108828949A (zh) 一种基于自适应动态规划的分布式最优协同容错控制方法
CN112180730B (zh) 一种多智能体系统分层最优一致性控制方法和装置
Huang et al. Distributed and adaptive triggering control for networked agents with linear dynamics
CN118068713A (zh) 一种非线性集群系统的编队合围跟踪最优控制方法及系统
CN116974185A (zh) 多智能体二分一致性的控制方法、装置、设备及存储介质
Jiang et al. Quantile-based policy optimization for reinforcement learning
Fan et al. Adaptive event-triggered prescribed performance learning synchronization for complex dynamical networks with unknown time-varying coupling strength
CN114967677B (zh) 一种非线性集群系统的时变编队跟踪优化控制方法及系统
VP et al. Finite horizon q-learning: Stability, convergence, simulations and an application on smart grids
Nagurney et al. On the stability of an adjustment process for spatial price equilibrium modeled as a projected dynamical system
Rani et al. Dynamics of a fishery system in a patchy environment with nonlinear harvesting
Mei et al. An economic model predictive control for knowledge transmission processes in multilayer complex networks
Li et al. Fixed-time anti-disturbance average-tracking for heterogeneous linear multiagent systems
Chen et al. Data-driven bipartite consensus control for multiagent systems: A low-quantity signal communication approach
CN114185273B (zh) 一种饱和受限下分布式前置时间一致性控制器的设计方法
CN116699979A (zh) 一种基于策略梯度的分布式多智能体系统最优控制方法
Fan et al. Distributed fuzzy adaptive consensus control for a class of heterogeneous multi-agent systems with nonidentical dimensions
Chen et al. [Retracted] Tracking Control of the Dynamic Input‐Output Economic System Based on Data Fusion
CN114755926A (zh) 一种基于强化学习的多智能体系统最优一致性的控制方法
CN114815598B (zh) 基于Stackelberg-Nash微分博弈的多层级优化控制系统与方法
Zhang et al. Zero‐sum game‐based H∞ optimal finite‐time prescribed performance control for nonlinear multiagent systems with actuator faults

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant