发布文献求助

A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play

强化学习计算机科学人工智能钢筋机器学习认知科学心理学社会心理学

作者

David Silver,Thomas Hubert,Julian Schrittwieser,Ioannis Antonoglou,Matthew Lai,Arthur Guez,Marc Lanctot,Laurent Sifre,Dharshan Kumaran,Thore Graepel,Timothy Lillicrap,Karen Simonyan,Demis Hassabis

出处

期刊：Science [American Association for the Advancement of Science (AAAS)]
日期：2018-12-06 卷期号：362 (6419): 1140-1144 被引量：3366

链接

标识

DOI：10.1126/science.aar6404

摘要

One program to rule them all Computers can beat humans at increasingly complex games, including chess and Go. However, these programs are typically constructed for a particular game, exploiting its properties, such as the symmetries of the board on which it is played. Silver et al. developed a program called AlphaZero, which taught itself to play Go, chess, and shogi (a Japanese version of chess) (see the Editorial, and the Perspective by Campbell). AlphaZero managed to beat state-of-the-art programs specializing in these three games. The ability of AlphaZero to adapt to various game rules is a notable step toward achieving a general game-playing system. Science , this issue p. 1140 ; see also pp. 1087 and 1118

求助该文献

最长约 10秒，即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞

我的文献求助列表浏览历史

一分钟了解求助规则 | 捐赠本站 | 历史今天

更新

新增更精细的自定义提醒设置 (2026-1-4)

新增

🕒每天60秒读懂世界·精选全球要闻 (2026-1-2)

更新

2025年影响因子查询已上线 (2025-6-18)

新增

PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台，具备全网最快的应助速度，最高的求助完成率。对每一个文献求助，科研通都将尽心尽力，给求助人一个满意的交代。

实时播报: 天天快乐的应助被心灵美的安南采纳，获得10

刚刚; 蓝天的应助被热心平萱采纳，获得10

刚刚; ZW完成签到，获得积分10

1秒前; 打打上传了应助文件

1秒前; 科研鸟发布了新的文献求助10

1秒前; 思源上传了应助文件

2秒前; 彭于晏的应助被haha采纳，获得30

3秒前; dn发布了新的文献求助10

3秒前; 张张张xxx发布了新的文献求助10

3秒前; 科研通AI6.2的应助被13831555290采纳，获得100

4秒前; 老艺人发布了新的文献求助10

4秒前; 老baby的应助被13831555290采纳，获得10

4秒前; 老baby的应助被13831555290采纳，获得10

4秒前; 11完成签到，获得积分20

7秒前; Damon完成签到，获得积分0

8秒前; 54545发布了新的文献求助10

9秒前; 鱼子西完成签到，获得积分10

11秒前; 小象完成签到，获得积分10

12秒前; 蓝天的应助被lbl234采纳，获得10

14秒前; dn完成签到，获得积分10

14秒前; 123完成签到，获得积分10

17秒前; 希望天下0贩的0的应助被马嘉祺超绝鸡肉线采纳，获得10

17秒前; 希望天下0贩的0的应助被11采纳，获得10

17秒前; 多摩川的烟花少年关闭了多摩川的烟花少年的文献求助

17秒前; 壮观的冰蝶发布了新的文献求助10

18秒前; xvan驳回了完美世界的应助

19秒前; 化工牛马人上传了应助文件

20秒前; 星辰大海的应助被落后枫叶采纳，获得30

24秒前; 多摩川的烟花少年关闭了多摩川的烟花少年的文献求助

28秒前; 科研通AI6.1上传了应助文件

29秒前; zgsslq完成签到，获得积分10

29秒前; 可乐完成签到，获得积分10

30秒前; 悠悠上传了应助文件

30秒前; ming关闭了ming的文献求助

31秒前; shen发布了新的文献求助30

31秒前; wish完成签到，获得积分10

34秒前; Clarie完成签到，获得积分10

35秒前; 斯文的老虎完成签到，获得积分10

36秒前; 爱笑的月亮发布了新的文献求助10

37秒前; ooo完成签到，获得积分10

38秒前

高分求助中: (应助此贴封号)【重要！！请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000; Les Mantodea de guyane 2500; Signals, Systems, and Signal Processing 510; Discrete-Time Signals and Systems 510; The Dance of Butch/Femme: The Complementarity and Autonomy of Lesbian Gender Identity 500; Differentiation Between Social Groups: Studies in the Social Psychology of Intergroup Relations 350; 生活在欺瞒的年代：傅树介政治斗争回忆录 260

热门求助领域（近24小时）

热门帖子: 关注科研通微信公众号，转发送积分 5878707; 求助须知：如何正确求助？哪些是违规求助？ 6554985; 关于积分的说明 15685018; 捐赠科研通 4997834; 什么是DOI，文献DOI怎么找？ 2693201; 邀请新用户注册赠送积分活动 1635160; 关于科研通互助平台的介绍 1592710

今日热心研友

稳重的蛟凤

糟糕的铁锤

化工牛马人

殷勤的紫槐

专注的问寒

注：热心度 = 本日应助数 + 本日被采纳获取积分÷10

Copyright © 2020-2026 AbleSci.COM, 科研通, All Right Reserved

科研通是非营利科研互助平台，不忘初心，为科研助力

本站互助的所有文件仅供个人学习研究用，禁止任何人把求助的所得文献进行盈利或传播

皖ICP备2024041134号-1

皖公网安备34019202002308

科研通【文献互助QQ群】：如果您有特殊求助，或发布求助超过24小时未得到应助，可加群求助，群号：821889395【点击一键加群】

科研通【志愿服务QQ群】：如果您热爱文献互助，有热心愿意为更多人服务，请加入小伙伴群，点击申请加入

关注微信服务号

科研通