Hierarchical Reinforcement Learning

计算机科学 强化学习 分类学(生物学) 任务(项目管理) 集合(抽象数据类型) 分解 人工智能 机器学习 生态学 系统工程 工程类 生物 程序设计语言
作者
Shubham Pateria,Budhitama Subagdja,Ah‐Hwee Tan,Chai Quek
出处
期刊:ACM Computing Surveys [Association for Computing Machinery]
卷期号:54 (5): 1-35 被引量:196
标识
DOI:10.1145/3453160
摘要

Hierarchical Reinforcement Learning (HRL) enables autonomous decomposition of challenging long-horizon decision-making tasks into simpler subtasks. During the past years, the landscape of HRL research has grown profoundly, resulting in copious approaches. A comprehensive overview of this vast landscape is necessary to study HRL in an organized manner. We provide a survey of the diverse HRL approaches concerning the challenges of learning hierarchical policies, subtask discovery, transfer learning, and multi-agent learning using HRL. The survey is presented according to a novel taxonomy of the approaches. Based on the survey, a set of important open problems is proposed to motivate the future research in HRL. Furthermore, we outline a few suitable task domains for evaluating the HRL approaches and a few interesting examples of the practical applications of HRL in the Supplementary Material.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
k2k2k完成签到,获得积分10
1秒前
Eternity发布了新的文献求助60
1秒前
1秒前
张茜完成签到,获得积分10
1秒前
蔡蔡不菜菜完成签到,获得积分10
2秒前
科研通AI5应助贪玩凡阳采纳,获得10
2秒前
li完成签到,获得积分10
2秒前
3秒前
ZHOUZHEN完成签到,获得积分10
3秒前
深情安青应助迅语采纳,获得10
3秒前
严溯发布了新的文献求助10
3秒前
华仔应助欢呼的牛排采纳,获得10
3秒前
笑点低慕灵完成签到,获得积分10
4秒前
研友_VZG7GZ应助科研通管家采纳,获得10
4秒前
打打应助科研通管家采纳,获得10
4秒前
科研通AI5应助科研通管家采纳,获得10
4秒前
orixero应助科研通管家采纳,获得10
4秒前
pluto应助科研通管家采纳,获得20
4秒前
4秒前
深情安青应助科研通管家采纳,获得10
4秒前
5秒前
jtyt发布了新的文献求助10
5秒前
丘比特应助科研通管家采纳,获得10
5秒前
Raymond应助科研通管家采纳,获得10
5秒前
科研通AI5应助科研通管家采纳,获得10
5秒前
赘婿应助勤恳的雨文采纳,获得10
5秒前
我是老大应助科研通管家采纳,获得10
5秒前
5秒前
Raymond应助科研通管家采纳,获得10
5秒前
breaking发布了新的文献求助50
5秒前
Raymond应助科研通管家采纳,获得10
5秒前
pluto应助科研通管家采纳,获得20
5秒前
斯文败类应助xiaolongbao315采纳,获得10
5秒前
充电宝应助科研通管家采纳,获得10
5秒前
Akim应助科研通管家采纳,获得10
5秒前
科目三应助科研通管家采纳,获得10
5秒前
大模型应助科研通管家采纳,获得30
5秒前
小二郎应助李卓航采纳,获得10
5秒前
科研通AI5应助科研通管家采纳,获得10
5秒前
高分求助中
Les Mantodea de Guyane Insecta, Polyneoptera 2500
Mobilization, center-periphery structures and nation-building 600
Technologies supporting mass customization of apparel: A pilot project 600
Introduction to Strong Mixing Conditions Volumes 1-3 500
China—Art—Modernity: A Critical Introduction to Chinese Visual Expression from the Beginning of the Twentieth Century to the Present Day 430
Multichannel rotary joints-How they work 400
Tip60 complex regulates eggshell formation and oviposition in the white-backed planthopper, providing effective targets for pest control 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3796116
求助须知:如何正确求助?哪些是违规求助? 3341123
关于积分的说明 10304336
捐赠科研通 3057684
什么是DOI,文献DOI怎么找? 1677795
邀请新用户注册赠送积分活动 805683
科研通“疑难数据库(出版商)”最低求助积分说明 762732