Model-free optimal containment control of multi-agent systems based on actor-critic framework

遏制(计算机编程) 计算机科学 贝尔曼方程 趋同(经济学) 数学优化 最优控制 启发式 动态规划 功能(生物学) 控制(管理) 强化学习 纳什均衡 动作(物理) 人工神经网络 数学 人工智能 算法 量子力学 进化生物学 生物 物理 经济增长 经济 程序设计语言
作者
W. Wang,Xin Chen
出处
期刊:Neurocomputing [Elsevier BV]
卷期号:314: 242-250 被引量:26
标识
DOI:10.1016/j.neucom.2018.06.011
摘要

This paper deals with the model-free optimal containment control problem for a class of linear multi-agent systems (MASs). In the existing results concerning containment control of MASs, the dynamics of the MASs is required to be completely known. Differently, in this paper, we propose a new distributed self-learning control scheme based on action dependent heuristic dynamic programming (ADHDP) to achieve containment control, where the model of MASs is no longer needed. The containment control problem is first transformed into a regulation problem on the dynamics of the designed local containment error. The policy iteration method based on the designed state-action value function (also called the Q-function) is introduced to deal with such a regulation problem. The convergence analysis of this policy iteration method is also given. Neural network (NN) based actor-critic framework is adopted to approximate the optimal Q-functions and the optimal control policies for facilitating the implementation of the proposed method. It shows that the approximated control policies achieve the containment control and satisfy the global Nash equilibrium. Finally, the simulation results are provided to demonstrate the effectiveness of the developed approach.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
嘿嘿哈完成签到,获得积分10
刚刚
生物摸鱼大师完成签到 ,获得积分10
刚刚
pluto应助valiente采纳,获得10
刚刚
CipherSage应助RR采纳,获得10
1秒前
999999完成签到,获得积分10
2秒前
bi8bo完成签到,获得积分10
3秒前
3秒前
4秒前
zmyyds完成签到 ,获得积分10
4秒前
花成花发布了新的文献求助10
4秒前
5秒前
龙木目发布了新的文献求助100
5秒前
王哈哈完成签到,获得积分10
5秒前
1101592875完成签到,获得积分10
5秒前
芝士酱完成签到,获得积分10
5秒前
牟欣宇发布了新的文献求助10
6秒前
刘俊彤完成签到 ,获得积分10
6秒前
WTT发布了新的文献求助10
9秒前
10秒前
思源应助冷艳的语雪采纳,获得10
10秒前
13秒前
斯文败类应助xpc采纳,获得10
15秒前
15秒前
shuo0976完成签到,获得积分10
16秒前
一直成长发布了新的文献求助10
18秒前
XhuaQye发布了新的文献求助10
18秒前
NexusExplorer应助初晴后雨采纳,获得10
19秒前
深情安青应助花成花采纳,获得10
20秒前
可爱的函函应助Crowise采纳,获得10
20秒前
共享精神应助yixiaolou采纳,获得10
22秒前
核桃应助芝芝莓莓采纳,获得30
23秒前
我是老大应助淡定的勒采纳,获得10
23秒前
柠檬不吃酸完成签到 ,获得积分10
23秒前
fabian完成签到,获得积分10
24秒前
淡淡碧玉完成签到,获得积分10
24秒前
25秒前
李健应助JKL采纳,获得10
25秒前
小黑魔仙完成签到,获得积分10
27秒前
27秒前
彭于晏应助黄兴元采纳,获得10
27秒前
高分求助中
Principles of Economics, 11th Edition 10000
Prescott's Microbiology: 2026 Release ISE 10000
University Physics with Modern Physics, 16th edition 10000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Environmental Leverage in Times of Climate Crisis: Product Standards, Carbon Border Measures and Preferential Trade Agreements 1000
Interactions of Vowel Quality and Prosody in East Slavic 1000
Erwählung und Berufung bei Paulus: Bedeutung, Entwicklung und Funktion einer Vorstellung in ihrem frühjüdischen und griechisch-römischen Kontext 850
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 内科学 物理 复合材料 催化作用 细胞生物学 无机化学 光电子学 物理化学 电极 基因
热门帖子
关注 科研通微信公众号,转发送积分 7173199
求助须知:如何正确求助?哪些是违规求助? 8813871
关于积分的说明 18621010
捐赠科研通 6789742
什么是DOI,文献DOI怎么找? 3168300
关于科研通互助平台的介绍 2310625
邀请新用户注册赠送积分活动 2142948