清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

ME‐MADDPG: An efficient learning‐based motion planning method for multiple agents in complex environments

计算机科学 趋同(经济学) 适应性 过程(计算) 人工智能 运动(物理) 领域(数学) 样品(材料) 运动规划 变量(数学) 机器学习 机器人 数学 操作系统 纯数学 化学 经济 数学分析 生物 经济增长 色谱法 生态学
作者
Kaifang Wan,Dingwei Wu,Bo Li,Xiaoguang Gao,Zijian Hu,Daqing Chen
出处
期刊:International Journal of Intelligent Systems [Wiley]
卷期号:37 (3): 2393-2427 被引量:8
标识
DOI:10.1002/int.22778
摘要

Developing efficient motion policies for multiagents is a challenge in a decentralized dynamic situation, where each agent plans its own paths without knowing the policies of the other agents involved. This paper presents an efficient learning-based motion planning method for multiagent systems. It adopts the framework of multiagent deep deterministic policy gradient (MADDPG) to directly map partially observed information to motion commands for multiple agents. To improve the efficiency of MADDPG in sample utilization, so as to train more brilliant agents that can adapt to more complex environments, a strategy named mixed experience (ME) is introduced to MADDPG, and this has led to our proposed ME-MADDPG algorithm. The novel ME strategy can be embodied into three specific mechanisms: (1) an artificial potential field-based sample generator to produce high-quality samples in the early training stage; (2) a dynamic mixed sampling strategy to mix the training data from different sources with a variable proportion; (3) a delayed learning skill to stabilize the training of the multiple agents. A series of experiments have been conducted to verify the performance of the proposed ME-MADDPG algorithm, and it has been demonstrated that, compared with MADDPG, the proposed algorithm can significantly improve the convergence speed and convergence effect in the training process, and it has also shown better efficiency and better adaptability in complex dynamic environments while it is used for multiagent motion planning applications.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
钱念波发布了新的文献求助50
2秒前
liuqi完成签到 ,获得积分10
11秒前
今后应助neng采纳,获得30
22秒前
陈永伟完成签到,获得积分10
36秒前
wuludie应助科研通管家采纳,获得10
1分钟前
wuludie应助科研通管家采纳,获得10
1分钟前
ARIA完成签到 ,获得积分10
1分钟前
1分钟前
搬砖的化学男完成签到 ,获得积分0
1分钟前
nick完成签到,获得积分10
1分钟前
1分钟前
nczpf2010完成签到,获得积分10
1分钟前
wushang完成签到 ,获得积分10
1分钟前
沐雨篱边完成签到 ,获得积分10
2分钟前
2分钟前
neng发布了新的文献求助30
2分钟前
赧赧完成签到 ,获得积分10
2分钟前
伯爵完成签到 ,获得积分10
2分钟前
松鼠爱学习完成签到 ,获得积分10
2分钟前
qq完成签到 ,获得积分10
2分钟前
落忆完成签到 ,获得积分10
2分钟前
小猴子完成签到 ,获得积分10
2分钟前
wuludie应助科研通管家采纳,获得10
3分钟前
王一生完成签到,获得积分0
3分钟前
lhl完成签到,获得积分10
3分钟前
李健的小迷弟应助volvoamg采纳,获得20
3分钟前
GreenDuane完成签到 ,获得积分0
3分钟前
ZZzz完成签到 ,获得积分10
3分钟前
科研通AI2S应助钱念波采纳,获得10
3分钟前
ZHANG完成签到 ,获得积分10
3分钟前
fang完成签到,获得积分10
4分钟前
高高的笑柳完成签到 ,获得积分10
4分钟前
王佳豪完成签到,获得积分10
4分钟前
Damon完成签到 ,获得积分10
4分钟前
5分钟前
秋夜临完成签到,获得积分10
5分钟前
球球球心完成签到,获得积分10
5分钟前
球球球心发布了新的文献求助10
5分钟前
kean1943完成签到,获得积分10
5分钟前
萨尔莫斯完成签到,获得积分10
6分钟前
高分求助中
Technologies supporting mass customization of apparel: A pilot project 600
Introduction to Strong Mixing Conditions Volumes 1-3 500
Tip60 complex regulates eggshell formation and oviposition in the white-backed planthopper, providing effective targets for pest control 400
A Field Guide to the Amphibians and Reptiles of Madagascar - Frank Glaw and Miguel Vences - 3rd Edition 400
China Gadabouts: New Frontiers of Humanitarian Nursing, 1941–51 400
The Healthy Socialist Life in Maoist China, 1949–1980 400
Walking a Tightrope: Memories of Wu Jieping, Personal Physician to China's Leaders 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3798521
求助须知:如何正确求助?哪些是违规求助? 3344082
关于积分的说明 10318416
捐赠科研通 3060615
什么是DOI,文献DOI怎么找? 1679712
邀请新用户注册赠送积分活动 806761
科研通“疑难数据库(出版商)”最低求助积分说明 763353