Learning to Navigate Through Complex Dynamic Environment With Modular Deep Reinforcement Learning

强化学习 避障 计算机科学 模块化设计 任务(项目管理) 障碍物 一般化 人工智能 建筑 网络体系结构 实时计算 人机交互 分布式计算 机器人 工程类 移动机器人 计算机网络 艺术 数学分析 数学 系统工程 法学 政治学 视觉艺术 操作系统
作者
Yuanda Wang,Haibo He,Changyin Sun
出处
期刊:IEEE transactions on games [Institute of Electrical and Electronics Engineers]
卷期号:10 (4): 400-412 被引量:86
标识
DOI:10.1109/tg.2018.2849942
摘要

In this paper, we propose an end-to-end modular reinforcement learning architecture for a navigation task in complex dynamic environments with rapidly moving obstacles. In this architecture, the main task is divided into two subtasks: local obstacle avoidance and global navigation. For obstacle avoidance, we develop a two-stream Q-network, which processes spatial and temporal information separately and generates action values. The global navigation subtask is resolved by a conventional Q-network framework. An online learning network and an action scheduler are introduced to first combine two pretrained policies, and then continue exploring and optimizing until a stable policy is obtained. The two-stream Q-network obtains better performance than the conventional deep Q-learning approach in the obstacle avoidance subtask. Experiments on the main task demonstrate that the proposed architecture can efficiently avoid moving obstacles and complete the navigation task at a high success rate. The modular architecture enables parallel training and also demonstrates good generalization capability in different environments.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
1秒前
VISIN完成签到,获得积分10
2秒前
兮颜发布了新的文献求助10
3秒前
mick发布了新的文献求助10
5秒前
NEW完成签到,获得积分10
6秒前
王小布发布了新的文献求助10
7秒前
ding应助雪球采纳,获得30
7秒前
充电宝应助阿洁采纳,获得10
8秒前
8秒前
拉普拉斯妖完成签到,获得积分10
12秒前
朱洪帆完成签到,获得积分20
13秒前
tlh完成签到 ,获得积分10
13秒前
Ann完成签到,获得积分10
13秒前
哼1发布了新的文献求助10
14秒前
Hello应助酸辣土豆丝采纳,获得10
14秒前
哈哈发布了新的文献求助30
18秒前
齐静春完成签到,获得积分10
18秒前
aijians完成签到,获得积分10
19秒前
Jimmy完成签到,获得积分10
20秒前
半青一江完成签到 ,获得积分10
21秒前
22秒前
Criminology34应助曹艳龙采纳,获得10
22秒前
24秒前
25秒前
陈灵敏完成签到,获得积分10
26秒前
悦123456完成签到,获得积分10
27秒前
瘦子张发布了新的文献求助10
28秒前
30秒前
天天快乐应助欣喜的尔曼采纳,获得10
30秒前
深情安青应助Mp4采纳,获得10
30秒前
erik完成签到 ,获得积分10
31秒前
大方颦完成签到 ,获得积分10
31秒前
悦123456发布了新的文献求助10
32秒前
32秒前
jackzzs完成签到,获得积分10
32秒前
33秒前
英俊的铭应助科研通管家采纳,获得10
36秒前
36秒前
36秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Kinesiophobia : a new view of chronic pain behavior 2000
The Social Psychology of Citizenship 1000
Signals, Systems, and Signal Processing 510
Discrete-Time Signals and Systems 510
Brittle Fracture in Welded Ships 500
Lloyd's Register of Shipping's Approach to the Control of Incidents of Brittle Fracture in Ship Structures 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5925174
求助须知:如何正确求助?哪些是违规求助? 6944963
关于积分的说明 15826741
捐赠科研通 5053003
什么是DOI,文献DOI怎么找? 2718552
邀请新用户注册赠送积分活动 1673712
关于科研通互助平台的介绍 1608290