Reinforcement Learning: An Introduction

强化学习 马尔可夫决策过程 计算机科学 人工智能 时差学习 领域(数学) 钢筋 人工神经网络 机器学习 工程类 结构工程
作者
Richard S. Sutton,Andrew G. Barto
出处
期刊:IEEE Transactions on Neural Networks [Institute of Electrical and Electronics Engineers]
卷期号:16 (1): 285-286 被引量:10280
标识
DOI:10.1109/tnn.2004.842673
摘要

Reinforcement learning, one of the most active research areas in artificial intelligence, is a computational approach to learning whereby an agent tries to maximize the total amount of reward it receives when interacting with a complex, uncertain environment. In Reinforcement Learning, Richard Sutton and Andrew Barto provide a clear and simple account of the key ideas and algorithms of reinforcement learning. Their discussion ranges from the history of the field's intellectual foundations to the most recent developments and applications. The only necessary mathematical background is familiarity with elementary concepts of probability. The book is divided into three parts. Part I defines the reinforcement learning problem in terms of Markov decision processes. Part II provides basic solution methods: dynamic programming, Monte Carlo methods, and temporal-difference learning. Part III presents a unified view of the solution methods and incorporates artificial neural networks, eligibility traces, and planning; the two final chapters present case studies and consider the future of reinforcement learning.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
安详绮南发布了新的文献求助10
1秒前
2秒前
可爱的函函应助大鱼采纳,获得10
4秒前
flic发布了新的文献求助10
8秒前
10秒前
11秒前
zhuyy完成签到,获得积分10
11秒前
彭于晏应助火星上十八采纳,获得10
13秒前
13秒前
无花果应助张达采纳,获得10
14秒前
MrChew发布了新的文献求助10
15秒前
李吉婷发布了新的文献求助10
16秒前
cssfsa完成签到,获得积分10
16秒前
18秒前
kkk完成签到,获得积分10
20秒前
首席医官完成签到,获得积分10
21秒前
KingLancet完成签到,获得积分0
23秒前
23秒前
微笑的语芙完成签到,获得积分10
23秒前
Waeiyengyul关注了科研通微信公众号
23秒前
25秒前
15完成签到,获得积分10
26秒前
桂花酒酿完成签到,获得积分10
26秒前
糖醋可乐完成签到,获得积分10
26秒前
CodeCraft应助沉静的乐荷采纳,获得10
27秒前
豆浆来点蒜泥完成签到,获得积分10
28秒前
29秒前
ll完成签到 ,获得积分10
29秒前
辉辉完成签到,获得积分10
30秒前
Jasper应助甜蜜的凌旋采纳,获得10
31秒前
时云雁完成签到,获得积分20
31秒前
沉默丹亦完成签到,获得积分10
32秒前
怡然的代玉应助安详绮南采纳,获得10
33秒前
大爱仙尊发布了新的文献求助10
35秒前
35秒前
37秒前
可爱的函函应助add采纳,获得10
38秒前
huiseXT完成签到,获得积分10
39秒前
1111发布了新的文献求助10
39秒前
ztayx完成签到 ,获得积分10
40秒前
高分求助中
ФОРМИРОВАНИЕ АО "МЕЖДУНАРОДНАЯ КНИГА" КАК ВАЖНЕЙШЕЙ СИСТЕМЫ ОТЕЧЕСТВЕННОГО КНИГОРАСПРОСТРАНЕНИЯ 3000
Electron microscopy study of magnesium hydride (MgH2) for Hydrogen Storage 1000
生物降解型栓塞微球市场(按产品类型、应用和最终用户)- 2030 年全球预测 500
Quantum Computing for Quantum Chemistry 500
Thermal Expansion of Solids (CINDAS Data Series on Material Properties, v. I-4) 470
Fire Protection Handbook, 21st Edition volume1和volume2 360
Phylogenetic study of the order Polydesmida (Myriapoda: Diplopoda) 360
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3902514
求助须知:如何正确求助?哪些是违规求助? 3447282
关于积分的说明 10848140
捐赠科研通 3172537
什么是DOI,文献DOI怎么找? 1752936
邀请新用户注册赠送积分活动 847463
科研通“疑难数据库(出版商)”最低求助积分说明 789993