Human-level performance in 3D multiplayer games with population-based reinforcement learning

强化学习 地震(自然现象) 计算机科学 锦标赛 人口 人工智能 钢筋 人机交互 心理学 数学 社会心理学 组合数学 地质学 社会学 人口学 地震学
作者
Max Jaderberg,Wojciech Marian Czarnecki,Iain Dunning,Luke Marris,Guy Lever,Antonio García Castañeda,Charles Beattie,Neil C. Rabinowitz,Ari S. Morcos,Avraham Ruderman,Nicolas Sonnerat,Tim Green,Louise Deason,Joel Z. Leibo,David Silver,Demis Hassabis,Koray Kavukcuoglu,Thore Graepel
出处
期刊:Science [American Association for the Advancement of Science]
卷期号:364 (6443): 859-865 被引量:672
标识
DOI:10.1126/science.aau6249
摘要

Reinforcement learning (RL) has shown great success in increasingly complex single-agent environments and two-player turn-based games. However, the real world contains multiple agents, each learning and acting independently to cooperate and compete with other agents. We used a tournament-style evaluation to demonstrate that an agent can achieve human-level performance in a three-dimensional multiplayer first-person video game, Quake III Arena in Capture the Flag mode, using only pixels and game points scored as input. We used a two-tier optimization process in which a population of independent RL agents are trained concurrently from thousands of parallel matches on randomly generated environments. Each agent learns its own internal reward signal and rich representation of the world. These results indicate the great potential of multiagent reinforcement learning for artificial intelligence research.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
刚刚
1秒前
RIKU发布了新的文献求助10
1秒前
If完成签到 ,获得积分10
1秒前
Lily完成签到,获得积分10
1秒前
2秒前
FashionBoy应助刘馨蔓采纳,获得10
2秒前
李爱国应助乔树伟采纳,获得10
3秒前
ext发布了新的文献求助10
3秒前
3秒前
Jessie完成签到,获得积分10
3秒前
4秒前
脑洞疼应助玲子采纳,获得10
4秒前
爆米花应助cyy1226采纳,获得10
4秒前
www应助Momo01采纳,获得10
4秒前
林卷卷完成签到,获得积分10
4秒前
承欢发布了新的文献求助10
4秒前
5秒前
HCS发布了新的文献求助10
5秒前
魔幻书包发布了新的文献求助10
5秒前
科研通AI6.1应助木一采纳,获得10
5秒前
Lily发布了新的文献求助10
5秒前
C1nderella发布了新的文献求助10
5秒前
lucky完成签到,获得积分20
5秒前
沙珠发布了新的文献求助10
5秒前
5秒前
Ln完成签到,获得积分10
5秒前
5秒前
煤气罐发布了新的文献求助10
5秒前
6秒前
bulabulabu完成签到,获得积分10
6秒前
王安卉发布了新的文献求助20
6秒前
Foch发布了新的文献求助10
6秒前
aikeyan完成签到,获得积分10
6秒前
7秒前
TiAmo完成签到 ,获得积分10
7秒前
Winfrednano完成签到,获得积分10
7秒前
打酱油的土八路完成签到,获得积分10
7秒前
7秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Leading Academic-Practice Partnerships in Nursing and Healthcare: A Paradigm for Change 800
Signals, Systems, and Signal Processing 610
Research Methods for Business: A Skill Building Approach, 9th Edition 500
Research Methods for Applied Linguistics 500
Picture Books with Same-sex Parented Families Unintentional Censorship 444
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6414517
求助须知:如何正确求助?哪些是违规求助? 8233439
关于积分的说明 17481902
捐赠科研通 5467326
什么是DOI,文献DOI怎么找? 2888702
邀请新用户注册赠送积分活动 1865659
关于科研通互助平台的介绍 1703321