Representation Learning and Reinforcement Learning for Dynamic Complex Motion Planning System

强化学习 计算机科学 趋同(经济学) 编码(内存) 运动规划 代表(政治) 运动(物理) 人工智能 编码(集合论) 状态空间 机器学习 离线学习 算法 机器人 在线学习 集合(抽象数据类型) 数学 万维网 经济 程序设计语言 法学 统计 政治 经济增长 政治学
作者
Chengmin Zhou,Bingding Huang,Pasi Fränti
出处
期刊:IEEE transactions on neural networks and learning systems [Institute of Electrical and Electronics Engineers]
卷期号:35 (8): 11049-11063 被引量:5
标识
DOI:10.1109/tnnls.2023.3247160
摘要

Indoor motion planning challenges researchers because of the high density and unpredictability of moving obstacles. Classical algorithms work well in the case of static obstacles but suffer from collisions in the case of dense and dynamic obstacles. Recent reinforcement learning (RL) algorithms provide safe solutions for multiagent robotic motion planning systems. However, these algorithms face challenges in convergence: slow convergence speed and suboptimal converged result. Inspired by RL and representation learning, we introduced the ALN-DSAC: a hybrid motion planning algorithm where attention-based long short-term memory (LSTM) and novel data replay combine with discrete soft actor–critic (SAC). First, we implemented a discrete SAC algorithm, which is the SAC in the setting of discrete action space. Second, we optimized existing distance-based LSTM encoding by attention-based encoding to improve the data quality. Third, we introduced a novel data replay method by combining the online learning and offline learning to improve the efficacy of data replay. The convergence of our ALN-DSAC outperforms that of the trainable state of the arts. Evaluations demonstrate that our algorithm achieves nearly 100% success with less time to reach the goal in motion planning tasks when compared to the state of the arts. The test code is available at https://github.com/CHUENGMINCHOU/ALN-DSAC.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
晰默完成签到,获得积分10
1秒前
凤梨爱好者完成签到,获得积分20
1秒前
小马甲应助LYJ采纳,获得10
1秒前
LHH完成签到 ,获得积分10
1秒前
1秒前
黄科研完成签到,获得积分10
1秒前
2秒前
zzq完成签到,获得积分20
2秒前
天地一体完成签到,获得积分10
2秒前
桐桐应助研友_nvg41Z采纳,获得10
2秒前
2秒前
3秒前
郜雨寒完成签到,获得积分10
3秒前
顾矜应助Sam采纳,获得10
3秒前
Chloe完成签到,获得积分10
3秒前
牛吃鱼完成签到,获得积分10
3秒前
清和完成签到,获得积分10
4秒前
XYY完成签到,获得积分10
4秒前
4秒前
完美世界应助babybao采纳,获得10
4秒前
5秒前
5秒前
AYN完成签到 ,获得积分10
6秒前
洋葱完成签到,获得积分10
6秒前
Aria完成签到,获得积分10
6秒前
付艳完成签到,获得积分10
6秒前
Mr.Reese完成签到,获得积分10
6秒前
7秒前
7秒前
7秒前
7秒前
完美世界应助墨之默采纳,获得10
7秒前
xqing完成签到,获得积分10
8秒前
axl发布了新的文献求助10
8秒前
子渊完成签到 ,获得积分10
8秒前
陈秋发布了新的文献求助10
9秒前
9秒前
沉静梦曼完成签到 ,获得积分10
9秒前
9秒前
9秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Kinesiophobia : a new view of chronic pain behavior 3000
Molecular Biology of Cancer: Mechanisms, Targets, and Therapeutics 1100
3O - Innate resistance in EGFR mutant non-small cell lung cancer (NSCLC) patients by coactivation of receptor tyrosine kinases (RTKs) 1000
Signals, Systems, and Signal Processing 510
Discrete-Time Signals and Systems 510
Proceedings of the Fourth International Congress of Nematology, 8-13 June 2002, Tenerife, Spain 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5936812
求助须知:如何正确求助?哪些是违规求助? 7033076
关于积分的说明 15867568
捐赠科研通 5066332
什么是DOI,文献DOI怎么找? 2724912
邀请新用户注册赠送积分活动 1683197
关于科研通互助平台的介绍 1611872