Global-and-Local Attention-Based Reinforcement Learning for Cooperative Behaviour Control of Multiple UAVs

强化学习 灵活性(工程) 避碰 计算机科学 适应性 控制(管理) 任务(项目管理) 过程(计算) 人工智能 工程类 分布式计算 碰撞 生态学 统计 数学 计算机安全 系统工程 生物 操作系统
作者
Jinchao Chen,Tingyang Li,Ying Zhang,Tao You,Yantao Lu,Prayag Tiwari,Neeraj Kumar
出处
期刊:IEEE Transactions on Vehicular Technology [Institute of Electrical and Electronics Engineers]
卷期号:73 (3): 4194-4206 被引量:102
标识
DOI:10.1109/tvt.2023.3327571
摘要

Due to the strong adaptability and high flexibility, unmanned aerial vehicles (UAVs) have been extensively studied and widely applied in both civil and military applications. Although UAVs can achieve significant cost reduction and performance enhancement in large-scale systems by taking full advantage of their cooperation and coordination, they result in a serious cooperative behaviour control problem. Especially in dynamic environments, the cooperative behaviour control problem which has to quickly produce a safe and effective behaviour decision for each UAV to achieve group missions, is NP-hard and difficult to settle. In this work, we design a global-and-local attention-based reinforcement learning algorithm for the cooperative behaviour control problem of UAVs. First, with the motion and coordination models, we analyze the collision avoidance, motion state update, and task execution constraints of multiple UAVs, and abstract the cooperative behaviour control problem as a multi-constraint decision-making one. Then, inspired from the human-learning process where more attention is devoted to the important parts of data, we design a multi-agent reinforcement learning algorithm with a global-and-local attention mechanism to cooperatively control the behaviours of UAVs and achieve the coordination. Simulation experiments in a multi-agent particle environment provided by OpenAI are conducted to verify the effectiveness and efficiency of the proposed approach. Compared with baselines, our approach shows significant advantages in mean reward, training time, and coordination effect.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
烟花应助JJJ采纳,获得30
2秒前
安详雅绿发布了新的文献求助50
4秒前
isedu完成签到,获得积分0
7秒前
量子星尘发布了新的文献求助10
9秒前
17秒前
hadfunsix完成签到 ,获得积分10
20秒前
21秒前
qq完成签到 ,获得积分10
22秒前
雨前知了完成签到,获得积分10
31秒前
量子星尘发布了新的文献求助10
34秒前
Overlap完成签到 ,获得积分10
42秒前
研友_VZG7GZ应助咸鱼王采纳,获得10
43秒前
Lexi完成签到 ,获得积分10
43秒前
量子星尘发布了新的文献求助10
51秒前
55秒前
Arctic完成签到 ,获得积分10
58秒前
咸鱼王发布了新的文献求助10
1分钟前
是why耶完成签到 ,获得积分10
1分钟前
云峤完成签到 ,获得积分10
1分钟前
victory_liu完成签到,获得积分10
1分钟前
薯条完成签到 ,获得积分10
1分钟前
Beyond095完成签到 ,获得积分10
1分钟前
量子星尘发布了新的文献求助10
1分钟前
loren313完成签到,获得积分0
1分钟前
尕雨茼学完成签到 ,获得积分10
1分钟前
玖月完成签到 ,获得积分0
1分钟前
甜美的友灵完成签到 ,获得积分10
1分钟前
科研通AI6.3应助佳子采纳,获得10
1分钟前
陈鹿华完成签到 ,获得积分10
1分钟前
1分钟前
1分钟前
曈曦完成签到 ,获得积分10
1分钟前
前行的灿完成签到 ,获得积分10
1分钟前
欢呼雪碧完成签到 ,获得积分10
1分钟前
量子星尘发布了新的文献求助10
1分钟前
ylky完成签到 ,获得积分10
1分钟前
咸鱼王完成签到,获得积分10
1分钟前
muzi完成签到,获得积分10
1分钟前
ty完成签到 ,获得积分10
1分钟前
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
No Good Deed Goes Unpunished 1100
Bioseparations Science and Engineering Third Edition 1000
Lloyd's Register of Shipping's Approach to the Control of Incidents of Brittle Fracture in Ship Structures 1000
BRITTLE FRACTURE IN WELDED SHIPS 1000
Entre Praga y Madrid: los contactos checoslovaco-españoles (1948-1977) 1000
Polymorphism and polytypism in crystals 1000
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6102670
求助须知:如何正确求助?哪些是违规求助? 7932191
关于积分的说明 16429527
捐赠科研通 5230774
什么是DOI,文献DOI怎么找? 2795508
邀请新用户注册赠送积分活动 1777910
关于科研通互助平台的介绍 1651306