ME‐MADDPG: An efficient learning‐based motion planning method for multiple agents in complex environments

计算机科学 趋同(经济学) 适应性 过程(计算) 人工智能 运动(物理) 领域(数学) 样品(材料) 运动规划 变量(数学) 机器学习 机器人 数学 操作系统 纯数学 化学 经济 数学分析 生物 经济增长 色谱法 生态学
作者
Kaifang Wan,Dingwei Wu,Bo Li,Xiaoguang Gao,Zijian Hu,Daqing Chen
出处
期刊:International Journal of Intelligent Systems [Wiley]
卷期号:37 (3): 2393-2427 被引量:29
标识
DOI:10.1002/int.22778
摘要

Developing efficient motion policies for multiagents is a challenge in a decentralized dynamic situation, where each agent plans its own paths without knowing the policies of the other agents involved. This paper presents an efficient learning-based motion planning method for multiagent systems. It adopts the framework of multiagent deep deterministic policy gradient (MADDPG) to directly map partially observed information to motion commands for multiple agents. To improve the efficiency of MADDPG in sample utilization, so as to train more brilliant agents that can adapt to more complex environments, a strategy named mixed experience (ME) is introduced to MADDPG, and this has led to our proposed ME-MADDPG algorithm. The novel ME strategy can be embodied into three specific mechanisms: (1) an artificial potential field-based sample generator to produce high-quality samples in the early training stage; (2) a dynamic mixed sampling strategy to mix the training data from different sources with a variable proportion; (3) a delayed learning skill to stabilize the training of the multiple agents. A series of experiments have been conducted to verify the performance of the proposed ME-MADDPG algorithm, and it has been demonstrated that, compared with MADDPG, the proposed algorithm can significantly improve the convergence speed and convergence effect in the training process, and it has also shown better efficiency and better adaptability in complex dynamic environments while it is used for multiagent motion planning applications.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
yuM发布了新的文献求助10
1秒前
2秒前
脆脆鲨发布了新的文献求助10
2秒前
xdlongchem完成签到,获得积分10
2秒前
俭朴依白发布了新的文献求助10
3秒前
派大星关注了科研通微信公众号
4秒前
4秒前
科研通AI5应助欣慰金鱼采纳,获得10
5秒前
波风水门发布了新的文献求助10
5秒前
5秒前
李健的小迷弟应助扎心采纳,获得10
5秒前
完美世界应助yuM采纳,获得10
5秒前
SophiaMX发布了新的文献求助10
6秒前
哈哈完成签到,获得积分10
7秒前
8秒前
8秒前
所所应助HLS采纳,获得10
8秒前
李晓萌完成签到 ,获得积分10
8秒前
9秒前
sci_zt发布了新的文献求助10
11秒前
脆脆鲨完成签到,获得积分10
11秒前
11秒前
绵绵发布了新的文献求助10
12秒前
健壮的代玉完成签到,获得积分10
12秒前
13秒前
15秒前
波风水门完成签到,获得积分10
17秒前
17秒前
18秒前
LALALA发布了新的文献求助10
18秒前
19秒前
21秒前
23秒前
pearlqi完成签到,获得积分10
23秒前
sbw发布了新的文献求助30
25秒前
26秒前
wang00wmd发布了新的文献求助20
26秒前
pearlqi发布了新的文献求助10
26秒前
27秒前
希望天下0贩的0应助LALALA采纳,获得10
28秒前
高分求助中
(应助此贴封号)【重要!!请各位详细阅读】【科研通的精品贴汇总】 10000
Quantum reference frames : from quantum information to spacetime 888
줄기세포 생물학 800
Pediatric Injectable Drugs 500
Instant Bonding Epoxy Technology 500
ASHP Injectable Drug Information 2025 Edition 400
DEALKOXYLATION OF β-CYANOPROPIONALDEYHDE DIMETHYL ACETAL 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4386735
求助须知:如何正确求助?哪些是违规求助? 3878997
关于积分的说明 12083106
捐赠科研通 3522541
什么是DOI,文献DOI怎么找? 1933241
邀请新用户注册赠送积分活动 974180
科研通“疑难数据库(出版商)”最低求助积分说明 872377