DM-DQN: Dueling Munchausen deep Q network for robot path planning

计算机科学 避障 机器人 数学优化 路径(计算) 趋同(经济学) 运动规划 一般化 人工智能 功能(生物学) 解耦(概率) 移动机器人 数学 控制工程 经济增长 进化生物学 生物 工程类 数学分析 经济 程序设计语言
作者
Yuwan Gu,Zhaoqin Zhu,Jidong Lv,Lin Shi,Zhenjie Hou,Shoukun Xu
出处
期刊:Complex & Intelligent Systems 卷期号:9 (4): 4287-4300 被引量:8
标识
DOI:10.1007/s40747-022-00948-7
摘要

Abstract In order to achieve collision-free path planning in complex environment, Munchausen deep Q-learning network (M-DQN) is applied to mobile robot to learn the best decision. On the basis of Soft-DQN, M-DQN adds the scaled log-policy to the immediate reward. The method allows agent to do more exploration. However, the M-DQN algorithm has the problem of slow convergence. A new and improved M-DQN algorithm (DM-DQN) is proposed in the paper to address the problem. First, its network structure was improved on the basis of M-DQN by decomposing the network structure into a value function and an advantage function, thus decoupling action selection and action evaluation and speeding up its convergence, giving it better generalization performance and enabling it to learn the best decision faster. Second, to address the problem of the robot’s trajectory being too close to the edge of the obstacle, a method of using an artificial potential field to set a reward function is proposed to drive the robot’s trajectory away from the vicinity of the obstacle. The result of simulation experiment shows that the method learns more efficiently and converges faster than DQN, Dueling DQN and M-DQN in both static and dynamic environments, and is able to plan collision-free paths away from obstacles.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刘春妍完成签到 ,获得积分10
刚刚
Viikey完成签到,获得积分10
1秒前
研友_LOqqmZ完成签到 ,获得积分10
2秒前
Ava应助chenyu采纳,获得10
5秒前
5秒前
寂静岭完成签到,获得积分10
6秒前
6秒前
小欢完成签到,获得积分10
7秒前
www完成签到,获得积分10
8秒前
S飞完成签到 ,获得积分10
9秒前
asjm完成签到 ,获得积分10
10秒前
sufeisunny完成签到 ,获得积分10
10秒前
发嗲的慕蕊完成签到 ,获得积分10
12秒前
lingling完成签到 ,获得积分10
13秒前
Dobronx03完成签到,获得积分10
14秒前
娇气的天亦完成签到,获得积分10
14秒前
ZhihaoZhu完成签到 ,获得积分10
15秒前
勤奋的汽车完成签到,获得积分10
16秒前
12366666完成签到,获得积分10
16秒前
摆哥完成签到,获得积分10
17秒前
迷惘墨香完成签到,获得积分10
17秒前
喜悦的千万完成签到 ,获得积分10
18秒前
流霜完成签到 ,获得积分10
19秒前
19秒前
yangy115完成签到,获得积分10
19秒前
niko完成签到 ,获得积分10
20秒前
Dobronx03完成签到,获得积分10
20秒前
缓慢白曼完成签到 ,获得积分10
20秒前
贤惠的碧空完成签到,获得积分10
22秒前
chenyu完成签到,获得积分10
22秒前
小蘑菇应助牛诗悦采纳,获得10
23秒前
赵嘉辉发布了新的文献求助10
24秒前
YOLO完成签到,获得积分10
25秒前
oldblack完成签到,获得积分10
26秒前
dlut0407完成签到,获得积分10
28秒前
啵清啵完成签到,获得积分10
29秒前
乔巴完成签到,获得积分10
30秒前
赵嘉辉完成签到,获得积分10
32秒前
等待断秋完成签到,获得积分10
34秒前
Lucas完成签到,获得积分10
36秒前
高分求助中
Manual of Clinical Microbiology, 4 Volume Set (ASM Books) 13th Edition 1000
Teaching Social and Emotional Learning in Physical Education 900
The three stars each : the Astrolabes and related texts 550
Boris Pesce - Gli impiegati della Fiat dal 1955 al 1999 un percorso nella memoria 500
[Lambert-Eaton syndrome without calcium channel autoantibodies] 500
少脉山油柑叶的化学成分研究 500
Recherches Ethnographiques sue les Yao dans la Chine du Sud 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2401486
求助须知:如何正确求助?哪些是违规求助? 2101110
关于积分的说明 5297284
捐赠科研通 1828774
什么是DOI,文献DOI怎么找? 911495
版权声明 560333
科研通“疑难数据库(出版商)”最低求助积分说明 487273