发布文献求助

清晨好，您是今天最早来到科研通的研友！由于当前在线用户较少，发布求助请尽量完整地填写文献信息，科研通机器人24小时在线，伴您科研之路漫漫前行！

The Surprising Effectiveness of PPO in Cooperative, Multi-Agent Games

强化学习计算机科学超参数领域（数学分析）编码（集合论）样品（材料）人工智能机器学习基线（sea）源代码数学化学海洋学集合（抽象数据类型）色谱法程序设计语言地质学数学分析操作系统

作者

Chao Yu,Akash Velu,Eugene Vinitsky,Gao, Jiaxuan,Yu Wang,Alexandre M. Bayen,Yi Wu

出处

期刊：Cornell University - arXiv 日期：2021-03-02 被引量：589

链接

arxiv.org arxiv.orgdoi.org

标识

DOI：10.48550/arxiv.2103.01955

摘要

Proximal Policy Optimization (PPO) is a ubiquitous on-policy reinforcement learning algorithm but is significantly less utilized than off-policy learning algorithms in multi-agent settings. This is often due to the belief that PPO is significantly less sample efficient than off-policy methods in multi-agent systems. In this work, we carefully study the performance of PPO in cooperative multi-agent settings. We show that PPO-based multi-agent algorithms achieve surprisingly strong performance in four popular multi-agent testbeds: the particle-world environments, the StarCraft multi-agent challenge, Google Research Football, and the Hanabi challenge, with minimal hyperparameter tuning and without any domain-specific algorithmic modifications or architectures. Importantly, compared to competitive off-policy methods, PPO often achieves competitive or superior results in both final returns and sample efficiency. Finally, through ablation studies, we analyze implementation and hyperparameter factors that are critical to PPO's empirical performance, and give concrete practical suggestions regarding these factors. Our results show that when using these practices, simple PPO-based methods can be a strong baseline in cooperative multi-agent reinforcement learning. Source code is released at \url{https://github.com/marlbenchmark/on-policy}.

求助该文献

最长约 10秒，即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

我的文献求助列表浏览历史

一分钟了解求助规则 | 捐赠本站 | 历史今天

更新

⚡ 2026年影响因子、分区 已更新！ (2026-6-17)

更新

📰 新增『新锐期刊分区』 (2026-3-24)

更新

💬 新增更精细的自定义提醒设置 (2026-1-4)

新增

🕒 每天60秒读懂世界·精选全球要闻 (2026-1-2)

新增

PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台，具备全网最快的应助速度，最高的求助完成率。对每一个文献求助，科研通都将尽心尽力，给求助人一个满意的交代。

实时播报: 会飞的柯基完成签到，获得积分10

8秒前; wenbinvan完成签到，获得积分0

15秒前; LiXF完成签到，获得积分10

31秒前; 海派甜心完成签到，获得积分10

39秒前; Copyright的应助被科研通管家采纳，获得10

39秒前; 甜甜以云完成签到，获得积分10

45秒前; 254237160完成签到，获得积分10

1分钟前; 科研通AI6.2上传了应助文件

1分钟前; JoeyJin发布了新的文献求助10

1分钟前; Copyright上传了应助文件

1分钟前; 科研通AI2S上传了应助文件

1分钟前; 元宝团子完成签到，获得积分10

1分钟前; 寒冷的月亮完成签到，获得积分10

1分钟前; 淡淡的问筠完成签到，获得积分10

2分钟前; WenJun完成签到，获得积分10

2分钟前; 佳言2009完成签到，获得积分10

2分钟前; 佳言2009完成签到，获得积分10

2分钟前; 华仔的应助被科研通管家采纳，获得10

2分钟前; orixero的应助被科研通管家采纳，获得10

2分钟前; 一只不受管束的小狸Miao完成签到，获得积分10

3分钟前; 结实新波完成签到，获得积分10

3分钟前; Copyright上传了应助文件

3分钟前; 科研通AI2S上传了应助文件

3分钟前; Elytra发布了新的文献求助10

4分钟前; 林利芳完成签到，获得积分10

4分钟前; Elytra完成签到，获得积分10

4分钟前; 香蕉觅云的应助被科研通管家采纳，获得10

4分钟前; 郝雨竹郝雨竹完成签到，获得积分10

5分钟前; 华仔上传了应助文件

5分钟前; pepper发布了新的文献求助10

5分钟前; daixan89完成签到，获得积分10

5分钟前; 科目三上传了应助文件

6分钟前; 李东东完成签到，获得积分10

6分钟前; 阿小苏发布了新的文献求助10

6分钟前; pete驳回了Kao的应助

6分钟前; Copyright的应助被科研通管家采纳，获得10

6分钟前; Copyright上传了应助文件

7分钟前; 王鑫完成签到，获得积分10

7分钟前; 傻傻的哈密瓜完成签到，获得积分10

7分钟前; 碗碗豆喵完成签到，获得积分10

7分钟前

高分求助中: (应助此贴封号)【重要！！请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000; Prompt Engineering for Clinicians: Harnessing AI in Everyday Medical Practice 600; REAL-WORLD EFFICACY AND GENOMIC LANDSCAPE OF POLATUZUMA VEDOTIN-BASED FIRST-LINE THERAPY IN DIFFUSE LARGE B-CELL LYMPHOMA: A FOCUS ON TP53 MUTATIONS AND TREATMENT RESPONSE 500; Handbook of Luminescence Dating 500; Safety Pharmacology 500; 《KNN基无铅压电陶瓷电学性能优化与物理机理研究》 500; Philosophy of Mind A Contemporary Introduction 5th Edition 400

热门求助领域（近24小时）

热门帖子: 关注科研通微信公众号，转发送积分 6969531; 求助须知：如何正确求助？哪些是违规求助？ 8650494; 关于积分的说明 18340944; 捐赠科研通 6425049; 什么是DOI，文献DOI怎么找？ 3089036; 关于科研通互助平台的介绍 2141613; 邀请新用户注册赠送积分活动 2065442

今日热心研友

殷勤的紫槐

俭朴的甜瓜

虚心八宝粥

学术文献互助

财神爷的小宝贝

贪玩的秋柔

注：热心度 = 本日应助数 + 本日被采纳获取积分÷10

Copyright © 2020-2026 AbleSci.COM, 科研通, All Right Reserved

科研通是非营利科研互助平台，不忘初心，为科研助力

本站互助的所有文件仅供个人学习研究用，禁止任何人把求助的所得文献进行盈利或传播

皖ICP备2024041134号-1

皖公网安备34019202002308

科研通【文献互助QQ群】：如果您有特殊求助，或发布求助超过24小时未得到应助，可加群求助，群号：821889395【点击一键加群】

科研通【志愿服务QQ群】：如果您热爱文献互助，有热心愿意为更多人服务，请加入小伙伴群，点击申请加入

关注微信服务号

科研通