Self-improving Reactive Agents: Case Studies of Reinforcement Learning Frameworks

强化学习 计算机科学 人工智能
作者
Long-Ji Lin
出处
期刊:The MIT Press eBooks [The MIT Press]
卷期号:: 297-305 被引量:52
标识
DOI:10.7551/mitpress/3115.003.0041
摘要

The purpose of this work is to investigate and evaluate different reinforcement learning frameworks using connectionist networks. I study four frameworks, which are adopted from the ideas developed by Rich Sutton and his colleagues. The four frameworks are based on two learning procedures: the Temporal Difference methods for solving the credit assignment problem, and the backpropagation algorithm for developing appropriate internal representations. Two of them also involve learning a world model and using it to speed learning. To evaluate their performance, I design a dynamic environment and implement different learning agents, using the different frameworks, to survive in it. The environment is nontrivial and nondeterministic. Surprisingly, all of the agents can learn to survive fairly well in a reasonable time frame. This paper describes the learning agents and their performance, and summarizes the learning algorithms and the lessons I learned from this study. This research was supported by NASA under Contract NAGW-1175. The views and conclusions contained in this document are those of the author and should not be interpreted as representing the official policies, either expressed or implied, of NASA.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
space完成签到 ,获得积分10
1秒前
Akim应助CY采纳,获得10
1秒前
2秒前
在水一方应助复杂飞飞采纳,获得10
3秒前
wdnyrrc发布了新的文献求助10
3秒前
6秒前
6秒前
yyq完成签到,获得积分10
7秒前
隐形萃完成签到 ,获得积分10
8秒前
librahapper发布了新的文献求助10
9秒前
HHF完成签到,获得积分10
9秒前
风华正茂发布了新的文献求助10
10秒前
11秒前
沙与沫完成签到 ,获得积分10
13秒前
15秒前
19秒前
欢喜的天空完成签到,获得积分20
21秒前
yarkye完成签到,获得积分10
23秒前
CY发布了新的文献求助10
23秒前
天真台灯完成签到,获得积分20
23秒前
25秒前
Tianju完成签到,获得积分10
25秒前
SciGPT应助Seagull采纳,获得10
25秒前
一只羊完成签到 ,获得积分10
26秒前
27秒前
rad1413完成签到 ,获得积分10
30秒前
劉劉完成签到 ,获得积分10
30秒前
31秒前
科研通AI2S应助CY采纳,获得10
31秒前
33秒前
Steven发布了新的文献求助30
33秒前
亭亭如盖发布了新的文献求助10
34秒前
37秒前
萌新完成签到 ,获得积分10
38秒前
Unicorn发布了新的文献求助10
44秒前
lucky完成签到,获得积分10
45秒前
哈哈哈发布了新的文献求助10
46秒前
颜沛文完成签到,获得积分10
55秒前
QR发布了新的文献求助10
56秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
Maneuvering of a Damaged Navy Combatant 650
Mixing the elements of mass customisation 300
the MD Anderson Surgical Oncology Manual, Seventh Edition 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3777986
求助须知:如何正确求助?哪些是违规求助? 3323635
关于积分的说明 10215128
捐赠科研通 3038833
什么是DOI,文献DOI怎么找? 1667645
邀请新用户注册赠送积分活动 798341
科研通“疑难数据库(出版商)”最低求助积分说明 758339