Optimized Formation Control Using Simplified Reinforcement Learning for a Class of Multiagent Systems With Unknown Dynamics

汉密尔顿-雅各比-贝尔曼方程 强化学习 标识符 非线性系统 计算机科学 最优控制 数学优化 控制理论(社会学) 等价(形式语言) 梯度下降 残余物 雅可比矩阵与行列式 多智能体系统 数学 人工神经网络 人工智能 应用数学 控制(管理) 算法 物理 离散数学 量子力学 程序设计语言
作者
Guoxing Wen,C. L. Philip Chen,Bin Li
出处
期刊:IEEE Transactions on Industrial Electronics [Institute of Electrical and Electronics Engineers]
卷期号:67 (9): 7879-7888 被引量:97
标识
DOI:10.1109/tie.2019.2946545
摘要

The article proposes an optimized leader-follower formation control using a simplified reinforcement learning (RL) of identifier-critic-actor architecture for a class of nonlinear multiagent systems. In general, optimal control is expected to be obtained by solving Hamilton-Jacobi-Bellman (HJB) equation, but the equation associated with a nonlinear system is difficult to solve by analytical method. Although the difficulty can be effectively overcome by the RL strategy, the existing RL algorithms are very complex because their updating laws are obtained by carrying out gradient descent algorithm to square of the approximated HJB equation (Bellman residual error). For a multiagent system, due to the state coupling problem, these methods will become difficult implementation. In the proposed optimized scheme, the RL updating laws are derived from negative gradient of a simple positive function, which is the equivalence to HJB equation; therefore, the control algorithm is significantly simple. Furthermore, in order to solve the problem of unknown system dynamics, an adaptive identifier is integrated into the control. Finally, the theory and simulation demonstrate that the optimized formation scheme can guarantee the desired control performance.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
共享精神应助YHT采纳,获得10
1秒前
Owen应助silent采纳,获得10
1秒前
2秒前
巴拉巴拉巴拉拉应助yx采纳,获得10
2秒前
陈陈完成签到 ,获得积分10
2秒前
2秒前
zxm完成签到,获得积分10
4秒前
勤劳怜寒发布了新的文献求助10
6秒前
8秒前
10秒前
田様应助rudjs采纳,获得10
10秒前
青天鸟1989完成签到,获得积分10
12秒前
端木熙发布了新的文献求助10
17秒前
17秒前
江岸与城完成签到 ,获得积分10
19秒前
20秒前
21秒前
鸡蛋花干夹馍完成签到,获得积分20
22秒前
rudjs发布了新的文献求助10
22秒前
CYY发布了新的文献求助10
24秒前
panyu发布了新的文献求助10
25秒前
yogurtli应助Llllll采纳,获得40
28秒前
隐形思山完成签到,获得积分10
28秒前
30秒前
Ayn完成签到 ,获得积分10
31秒前
思源应助yogurtli采纳,获得10
32秒前
可爱的咖啡完成签到,获得积分20
33秒前
34秒前
36秒前
36秒前
37秒前
41秒前
felix完成签到,获得积分10
44秒前
深情安青应助Yolo采纳,获得10
49秒前
49秒前
唠叨的秋天完成签到 ,获得积分10
50秒前
asdf发布了新的文献求助10
53秒前
善学以致用应助小巧弘文采纳,获得10
54秒前
H_C发布了新的文献求助10
54秒前
54秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
Maneuvering of a Damaged Navy Combatant 650
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
Mixing the elements of mass customisation 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3778908
求助须知:如何正确求助?哪些是违规求助? 3324476
关于积分的说明 10218591
捐赠科研通 3039495
什么是DOI,文献DOI怎么找? 1668258
邀请新用户注册赠送积分活动 798634
科研通“疑难数据库(出版商)”最低求助积分说明 758440