Deep Reinforcement Learning: A Brief Survey

强化学习 计算机科学 人工智能 深度学习 领域(数学) 人工神经网络 机器人学 异步通信 机器学习 机器人 电信 数学 纯数学
作者
Kai Arulkumaran,Marc Peter Deisenroth,Miles Brundage,Anil A. Bharath
出处
期刊:IEEE Signal Processing Magazine [Institute of Electrical and Electronics Engineers]
卷期号:34 (6): 26-38 被引量:3510
标识
DOI:10.1109/msp.2017.2743240
摘要

Deep reinforcement learning is poised to revolutionise the field of AI and represents a step towards building autonomous systems with a higher level understanding of the visual world. Currently, deep learning is enabling reinforcement learning to scale to problems that were previously intractable, such as learning to play video games directly from pixels. Deep reinforcement learning algorithms are also applied to robotics, allowing control policies for robots to be learned directly from camera inputs in the real world. In this survey, we begin with an introduction to the general field of reinforcement learning, then progress to the main streams of value-based and policy-based methods. Our survey will cover central algorithms in deep reinforcement learning, including the deep $Q$-network, trust region policy optimisation, and asynchronous advantage actor-critic. In parallel, we highlight the unique advantages of deep neural networks, focusing on visual understanding via reinforcement learning. To conclude, we describe several current areas of research within the field.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
咸鱼发布了新的文献求助50
1秒前
兔子应助tesla采纳,获得10
1秒前
linxunxiazhi完成签到,获得积分10
3秒前
4秒前
阔达乘云完成签到 ,获得积分10
4秒前
平淡远山完成签到,获得积分10
6秒前
8秒前
chino发布了新的文献求助10
9秒前
闲闲完成签到,获得积分10
9秒前
misa完成签到 ,获得积分10
10秒前
高贵的晓筠完成签到 ,获得积分10
11秒前
tivyg'lk发布了新的文献求助30
13秒前
kk完成签到 ,获得积分10
14秒前
美好的秋烟完成签到 ,获得积分10
18秒前
Gauss应助科研通管家采纳,获得30
20秒前
星辰大海应助科研通管家采纳,获得10
20秒前
loststarts应助科研通管家采纳,获得10
20秒前
脑洞疼应助科研通管家采纳,获得10
20秒前
李爱国应助科研通管家采纳,获得10
21秒前
CipherSage应助科研通管家采纳,获得10
21秒前
zxm666应助科研通管家采纳,获得200
21秒前
小二郎应助科研通管家采纳,获得10
21秒前
CodeCraft应助科研通管家采纳,获得10
21秒前
heavennew完成签到,获得积分10
21秒前
25秒前
天天快乐应助飘逸的秋翠采纳,获得10
28秒前
29秒前
29秒前
壮壮完成签到 ,获得积分10
30秒前
nansn完成签到,获得积分10
31秒前
bkagyin应助鱼儿长得胖采纳,获得10
33秒前
爆米花应助曾经的康乃馨采纳,获得10
33秒前
Mr_Qiu发布了新的文献求助10
33秒前
科研通AI6应助咸鱼采纳,获得10
34秒前
35秒前
mafei完成签到,获得积分10
35秒前
orixero应助tivyg'lk采纳,获得30
36秒前
SciGPT应助小坤不慌采纳,获得10
36秒前
mrzyfsci完成签到,获得积分10
38秒前
酷炫的__发布了新的文献求助10
40秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Rapid Review of Electrodiagnostic and Neuromuscular Medicine: A Must-Have Reference for Neurologists and Physiatrists 1000
François Ravary SJ and a Sino-European Musical Culture in Nineteenth-Century Shanghai 500
The Handbook of Communication Skills 500
求中国石油大学(北京)图书馆的硕士论文,作者董晨,十年前搞太赫兹的 500
基于3um sOl硅光平台的集成发射芯片关键器件研究 500
Educational Research: Planning, Conducting, and Evaluating Quantitative and Qualitative Research 460
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4796520
求助须知:如何正确求助?哪些是违规求助? 4116723
关于积分的说明 12735968
捐赠科研通 3846596
什么是DOI,文献DOI怎么找? 2119756
邀请新用户注册赠送积分活动 1141859
关于科研通互助平台的介绍 1031368