已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

FeUdal Networks for Hierarchical Reinforcement Learning

封建主义 强化学习 钢筋 计算机科学 人工智能 心理学 政治学 社会心理学 法学 政治
作者
Alexander Sasha Vezhnevets,Simon Osindero,Tom Schaul,Nicolas Heess,Max Jaderberg,David Silver,Koray Kavukcuoglu
出处
期刊:Cornell University - arXiv 被引量:413
标识
DOI:10.48550/arxiv.1703.01161
摘要

We introduce FeUdal Networks (FuNs): a novel architecture for hierarchical reinforcement learning. Our approach is inspired by the feudal reinforcement learning proposal of Dayan and Hinton, and gains power and efficacy by decoupling end-to-end learning across multiple levels -- allowing it to utilise different resolutions of time. Our framework employs a Manager module and a Worker module. The Manager operates at a lower temporal resolution and sets abstract goals which are conveyed to and enacted by the Worker. The Worker generates primitive actions at every tick of the environment. The decoupled structure of FuN conveys several benefits -- in addition to facilitating very long timescale credit assignment it also encourages the emergence of sub-policies associated with different goals set by the Manager. These properties allow FuN to dramatically outperform a strong baseline agent on tasks that involve long-term credit assignment or memorisation. We demonstrate the performance of our proposed system on a range of tasks from the ATARI suite and also from a 3D DeepMind Lab environment.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
天明发布了新的文献求助10
1秒前
1秒前
活力的香完成签到 ,获得积分10
2秒前
3秒前
yindingle发布了新的文献求助10
4秒前
6秒前
7秒前
8秒前
噜噜发布了新的文献求助10
8秒前
8秒前
Hydroxyl_Chen完成签到,获得积分10
8秒前
flipped完成签到,获得积分10
9秒前
FashionBoy应助王亚娟采纳,获得10
9秒前
mmyhn发布了新的文献求助10
9秒前
9秒前
完美世界应助郑倩文采纳,获得10
10秒前
感动满天发布了新的文献求助10
11秒前
晨许沫光完成签到 ,获得积分10
11秒前
12秒前
Hydroxyl_Chen发布了新的文献求助10
12秒前
12秒前
mmyhn发布了新的文献求助10
12秒前
天明完成签到,获得积分10
12秒前
NexusExplorer应助ai化学采纳,获得10
13秒前
qiuiqiu1111发布了新的文献求助10
14秒前
16秒前
FleurdelisDZhang完成签到,获得积分10
16秒前
自由的绯完成签到,获得积分10
16秒前
调皮的鱼发布了新的文献求助10
17秒前
杰桑的西地那非完成签到 ,获得积分10
17秒前
阿莹发布了新的文献求助10
17秒前
笑点低愫完成签到,获得积分20
19秒前
年少丶发布了新的文献求助10
21秒前
搜集达人应助精明的秋灵采纳,获得10
22秒前
答案加载中完成签到,获得积分10
22秒前
25秒前
呼和那日松完成签到 ,获得积分10
26秒前
xiaopanpan发布了新的文献求助10
26秒前
共享精神应助阿莹采纳,获得10
27秒前
不摇碧莲完成签到 ,获得积分10
27秒前
高分求助中
Lewis’s Child and Adolescent Psychiatry: A Comprehensive Textbook Sixth Edition 2000
Cronologia da história de Macau 1600
Treatment response-adapted risk index model for survival prediction and adjuvant chemotherapy selection in nonmetastatic nasopharyngeal carcinoma 1000
Lloyd's Register of Shipping's Approach to the Control of Incidents of Brittle Fracture in Ship Structures 1000
BRITTLE FRACTURE IN WELDED SHIPS 1000
Intentional optical interference with precision weapons (in Russian) Преднамеренные оптические помехи высокоточному оружию 1000
Atlas of Anatomy 5th original digital 2025的PDF高清电子版(非压缩版,大小约400-600兆,能更大就更好了) 1000
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 纳米技术 计算机科学 化学工程 生物化学 物理 复合材料 内科学 催化作用 物理化学 光电子学 细胞生物学 基因 电极 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6201906
求助须知:如何正确求助?哪些是违规求助? 8028960
关于积分的说明 16718866
捐赠科研通 5294663
什么是DOI,文献DOI怎么找? 2821404
邀请新用户注册赠送积分活动 1800955
关于科研通互助平台的介绍 1662863