A multi-robot path-planning algorithm for autonomous navigation using meta-reinforcement learning based on transfer learning

强化学习 计算机科学 CMA-ES公司 适应性 适应(眼睛) 趋同(经济学) 机器人 过程(计算) 运动规划 路径(计算) 人工智能 水准点(测量) 进化策略 协方差矩阵 动平衡 进化算法 机器学习 算法 工程类 经济 物理 光学 操作系统 生物 程序设计语言 机械工程 地理 经济增长 生态学 大地测量学
作者
Shuhuan Wen,Zeteng Wen,Di Zhang,Hong Zhang,Tao Wang
出处
期刊:Applied Soft Computing [Elsevier]
卷期号:110: 107605-107605 被引量:28
标识
DOI:10.1016/j.asoc.2021.107605
摘要

The adaptability of multi-robot systems in complex environments is a hot topic. Aiming at static and dynamic obstacles in complex environments, this paper presents dynamic proximal meta policy optimization with covariance matrix adaptation evolutionary strategies (dynamic-PMPO-CMA) to avoid obstacles and realize autonomous navigation. Firstly, we propose dynamic proximal policy optimization with covariance matrix adaptation evolutionary strategies (dynamic-PPO-CMA) based on original proximal policy optimization (PPO) to obtain a valid policy of obstacles avoidance. The simulation results show that the proposed dynamic-PPO-CMA can avoid obstacles and reach the designated target position successfully. Secondly, in order to improve the adaptability of multi-robot systems in different environments, we integrate meta-learning with dynamic-PPO-CMA to form the dynamic-PMPO-CMA algorithm. In training process, we use the proposed dynamic-PMPO-CMA to train robots to learn multi-task policy. Finally, in testing process, transfer learning is introduced to the proposed dynamic-PMPO-CMA algorithm. The trained parameters of meta policy are transferred to new environments and regarded as the initial parameters. The simulation results show that the proposed algorithm can have faster convergence rate and arrive the destination more quickly than PPO, PMPO and dynamic-PPO-CMA.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
卡农完成签到,获得积分10
1秒前
2秒前
lxyonline完成签到 ,获得积分10
4秒前
一个小目标完成签到,获得积分10
7秒前
王逗逗发布了新的文献求助10
8秒前
可爱的函函应助龙行天下采纳,获得10
8秒前
8秒前
小颜发布了新的文献求助10
8秒前
天天快乐应助infini采纳,获得10
9秒前
10秒前
祖之微笑发布了新的文献求助10
12秒前
13秒前
Maths完成签到 ,获得积分10
13秒前
GXB发布了新的文献求助10
15秒前
坚强的广山应助王逗逗采纳,获得10
17秒前
JET_Li发布了新的文献求助10
17秒前
崔佳鑫完成签到 ,获得积分10
23秒前
lisa完成签到,获得积分10
23秒前
芙瑞完成签到 ,获得积分10
23秒前
奋斗的小张完成签到 ,获得积分10
24秒前
26秒前
彭于晏应助柒月采纳,获得10
26秒前
27秒前
金坚完成签到,获得积分20
28秒前
chao发布了新的文献求助10
29秒前
结实的德地完成签到,获得积分10
29秒前
悦耳的绿旋完成签到,获得积分10
31秒前
31秒前
闪闪山水发布了新的文献求助10
32秒前
针尖上的王子完成签到,获得积分10
34秒前
情怀应助快乐的烨磊采纳,获得10
35秒前
英俊的铭应助愤怒的觅珍采纳,获得10
36秒前
cyxcr发布了新的文献求助10
38秒前
39秒前
41秒前
打打应助远方采纳,获得10
43秒前
Anky完成签到 ,获得积分10
43秒前
在水一方应助闪闪山水采纳,获得10
43秒前
SciGPT应助强健的建辉采纳,获得10
44秒前
zijinbeier完成签到 ,获得积分10
44秒前
高分求助中
请在求助之前详细阅读求助说明!!!! 20000
The Three Stars Each: The Astrolabes and Related Texts 900
Yuwu Song, Biographical Dictionary of the People's Republic of China 700
Bernd Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
A radiographic standard of reference for the growing knee 400
Glossary of Geology 400
Additive Manufacturing Design and Applications 320
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2474094
求助须知:如何正确求助?哪些是违规求助? 2139091
关于积分的说明 5451650
捐赠科研通 1863070
什么是DOI,文献DOI怎么找? 926308
版权声明 562817
科研通“疑难数据库(出版商)”最低求助积分说明 495512