Online robot guidance and navigation in non-stationary environment with hybrid Hierarchical Reinforcement Learning

强化学习 计算机科学 任务(项目管理) 人工智能 机器学习 状态空间 趋同(经济学) 功能(生物学) 机器人 分解 数学 经济增长 进化生物学 生物 生态学 统计 经济 管理
作者
Ye Zhou,Hann Woei Ho
出处
期刊:Engineering Applications of Artificial Intelligence [Elsevier BV]
卷期号:114: 105152-105152 被引量:10
标识
DOI:10.1016/j.engappai.2022.105152
摘要

Hierarchical Reinforcement Learning (HRL) provides an option to solve complex guidance and navigation problems with high-dimensional spaces, multiple objectives, and a large number of states and actions. The current HRL methods often use the same or similar reinforcement learning methods within one application so that multiple objectives can be easily combined. Since there is not a single learning method that can benefit all targets, hybrid Hierarchical Reinforcement Learning (hHRL) was proposed to use various methods to optimize the learning with different types of information and objectives in one application. The previous hHRL method, however, requires manual task-specific designs, which involves engineers' preferences and may impede its transfer learning ability. This paper, therefore, proposes a systematic online guidance and navigation method under the framework of hHRL, which generalizes training samples with a function approximator, decomposes the state space automatically, and thus does not require task-specific designs. The simulation results indicate that the proposed method is superior to the previous hHRL method, which requires manual decomposition, in terms of the convergence rate and the learnt policy. It is also shown that this method is generally applicable to non-stationary environments changing over episodes and over time without the loss of efficiency even with noisy state information.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
雪碧加冰完成签到,获得积分10
刚刚
张利君关注了科研通微信公众号
1秒前
寄往光明完成签到,获得积分10
1秒前
zlf完成签到,获得积分10
2秒前
仓鼠侠完成签到,获得积分20
3秒前
lpf发布了新的文献求助10
3秒前
齐路明发布了新的文献求助10
3秒前
Jiayi完成签到,获得积分10
3秒前
刘乐源发布了新的文献求助10
3秒前
4秒前
乙醇完成签到,获得积分10
4秒前
中和皇极应助shengdong采纳,获得20
5秒前
小高完成签到 ,获得积分10
6秒前
6秒前
6秒前
xinyue发布了新的文献求助10
8秒前
研友_VZG7GZ应助baixue采纳,获得10
8秒前
八荒来犬发布了新的文献求助10
9秒前
10秒前
糊里糊涂完成签到 ,获得积分10
10秒前
今后应助儒雅的豪采纳,获得10
12秒前
Washfacemilk发布了新的文献求助10
12秒前
桐桐应助科研通管家采纳,获得10
13秒前
研友_VZG7GZ应助科研通管家采纳,获得10
14秒前
李爱国应助科研通管家采纳,获得10
14秒前
Akim应助gyusbjshaxb采纳,获得30
14秒前
14秒前
科研通AI5应助科研通管家采纳,获得15
14秒前
顺利皮蛋应助科研通管家采纳,获得10
14秒前
完美世界应助科研通管家采纳,获得10
14秒前
充电宝应助科研通管家采纳,获得10
14秒前
14秒前
斯文败类应助科研通管家采纳,获得10
14秒前
汉堡包应助科研通管家采纳,获得10
15秒前
香蕉觅云应助科研通管家采纳,获得10
15秒前
顺利皮蛋应助科研通管家采纳,获得10
15秒前
丘比特应助科研通管家采纳,获得10
15秒前
完美世界应助科研通管家采纳,获得10
15秒前
15秒前
科研通AI6应助科研通管家采纳,获得10
15秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Aircraft Engine Design, Third Edition 500
Neonatal and Pediatric ECMO Simulation Scenarios 500
苏州地下水中新污染物及其转化产物的非靶向筛查 500
Rapid Review of Electrodiagnostic and Neuromuscular Medicine: A Must-Have Reference for Neurologists and Physiatrists 500
Vertebrate Palaeontology, 5th Edition 500
碳捕捉技术能效评价方法 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4746790
求助须知:如何正确求助?哪些是违规求助? 4094282
关于积分的说明 12666770
捐赠科研通 3806195
什么是DOI,文献DOI怎么找? 2101322
邀请新用户注册赠送积分活动 1126627
关于科研通互助平台的介绍 1003206