A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play

强化学习 计算机科学 人工智能 钢筋 机器学习 认知科学 心理学 社会心理学
作者
David Silver,Thomas Hubert,Julian Schrittwieser,Ioannis Antonoglou,Matthew Lai,Arthur Guez,Marc Lanctot,Laurent Sifre,Dharshan Kumaran,Thore Graepel,Timothy Lillicrap,Karen Simonyan,Demis Hassabis
出处
期刊:Science [American Association for the Advancement of Science (AAAS)]
卷期号:362 (6419): 1140-1144 被引量:3366
标识
DOI:10.1126/science.aar6404
摘要

One program to rule them all Computers can beat humans at increasingly complex games, including chess and Go. However, these programs are typically constructed for a particular game, exploiting its properties, such as the symmetries of the board on which it is played. Silver et al. developed a program called AlphaZero, which taught itself to play Go, chess, and shogi (a Japanese version of chess) (see the Editorial, and the Perspective by Campbell). AlphaZero managed to beat state-of-the-art programs specializing in these three games. The ability of AlphaZero to adapt to various game rules is a notable step toward achieving a general game-playing system. Science , this issue p. 1140 ; see also pp. 1087 and 1118
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
蓝天应助热心平萱采纳,获得10
刚刚
ZW完成签到 ,获得积分10
1秒前
1秒前
科研鸟发布了新的文献求助10
1秒前
2秒前
彭于晏应助haha采纳,获得30
3秒前
dn发布了新的文献求助10
3秒前
张张张xxx发布了新的文献求助10
3秒前
科研通AI6.2应助13831555290采纳,获得100
4秒前
老艺人发布了新的文献求助10
4秒前
老baby应助13831555290采纳,获得10
4秒前
老baby应助13831555290采纳,获得10
4秒前
11完成签到,获得积分20
7秒前
Damon完成签到 ,获得积分0
8秒前
54545发布了新的文献求助10
9秒前
鱼子西完成签到,获得积分10
11秒前
小象完成签到,获得积分10
12秒前
蓝天应助lbl234采纳,获得10
14秒前
dn完成签到,获得积分10
14秒前
123完成签到 ,获得积分10
17秒前
17秒前
希望天下0贩的0应助11采纳,获得10
17秒前
17秒前
18秒前
19秒前
20秒前
星辰大海应助落后枫叶采纳,获得30
24秒前
28秒前
29秒前
zgsslq完成签到,获得积分10
29秒前
可乐完成签到 ,获得积分10
30秒前
30秒前
31秒前
shen发布了新的文献求助30
31秒前
wish完成签到 ,获得积分10
34秒前
Clarie完成签到 ,获得积分10
35秒前
斯文的老虎完成签到,获得积分10
36秒前
37秒前
ooo完成签到,获得积分10
38秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Les Mantodea de guyane 2500
Signals, Systems, and Signal Processing 510
Discrete-Time Signals and Systems 510
The Dance of Butch/Femme: The Complementarity and Autonomy of Lesbian Gender Identity 500
Differentiation Between Social Groups: Studies in the Social Psychology of Intergroup Relations 350
生活在欺瞒的年代:傅树介政治斗争回忆录 260
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5878707
求助须知:如何正确求助?哪些是违规求助? 6554985
关于积分的说明 15685018
捐赠科研通 4997834
什么是DOI,文献DOI怎么找? 2693201
邀请新用户注册赠送积分活动 1635160
关于科研通互助平台的介绍 1592710