Learning when to Communicate at Scale in Multiagent Cooperative and Competitive Tasks

可扩展性 计算机科学 盈利能力指数 趋同(经济学) 分布式计算 多样性(控制论) 比例(比率) 钥匙(锁) 简单(哲学) 人工智能 计算机安全 认识论 数据库 物理 量子力学 经济增长 哲学 经济 财务
作者
Amanpreet Singh,Tushar Jain,Sainbayar Sukhbaatar
出处
期刊:Cornell University - arXiv 被引量:26
摘要

Learning when to communicate and doing that effectively is essential in multi-agent tasks. Recent works show that continuous communication allows efficient training with back-propagation in multi-agent scenarios, but have been restricted to fully-cooperative tasks. In this paper, we present Individualized Controlled Continuous Communication Model (IC3Net) which has better training efficiency than simple continuous communication model, and can be applied to semi-cooperative and competitive settings along with the cooperative settings. IC3Net controls continuous communication with a gating mechanism and uses individualized rewards foreach agent to gain better performance and scalability while fixing credit assignment issues. Using variety of tasks including StarCraft BroodWars explore and combat scenarios, we show that our network yields improved performance and convergence rates than the baselines as the scale increases. Our results convey that IC3Net agents learn when to communicate based on the scenario and profitability.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
可爱的如冬完成签到,获得积分10
刚刚
土豆侠完成签到 ,获得积分10
1秒前
2秒前
3秒前
Dr司发布了新的文献求助10
5秒前
zht发布了新的文献求助10
7秒前
7秒前
Suzy发布了新的文献求助10
10秒前
ZX完成签到,获得积分10
11秒前
ned发布了新的文献求助10
12秒前
大模型应助kate采纳,获得10
14秒前
小乔同学完成签到,获得积分10
17秒前
叶子完成签到,获得积分10
18秒前
Suzy完成签到,获得积分10
19秒前
22秒前
张泽崇应助冯梦梦采纳,获得10
23秒前
瑞瑞完成签到,获得积分10
25秒前
26秒前
CodeCraft应助Yiy采纳,获得10
27秒前
鲁丹萱完成签到 ,获得积分10
29秒前
aaazyha发布了新的文献求助10
31秒前
wyh123完成签到 ,获得积分10
31秒前
Siwen完成签到,获得积分20
35秒前
39秒前
39秒前
小二郎应助可爱的觅夏采纳,获得10
40秒前
42秒前
43秒前
kate发布了新的文献求助10
43秒前
45秒前
Jasper应助Siwen采纳,获得10
45秒前
一池楼台完成签到 ,获得积分10
46秒前
song_caixia发布了新的文献求助10
47秒前
47秒前
zxy发布了新的文献求助10
47秒前
aaazyha完成签到,获得积分20
49秒前
49秒前
51秒前
qwe完成签到 ,获得积分10
53秒前
逸龙完成签到,获得积分10
53秒前
高分求助中
Manual of Clinical Microbiology, 4 Volume Set (ASM Books) 13th Edition 1000
Cross-Cultural Psychology: Critical Thinking and Contemporary Applications (8th edition) 800
Counseling With Immigrants, Refugees, and Their Families From Social Justice Perspectives pages 800
マンネンタケ科植物由来メロテルペノイド類の網羅的全合成/Collective Synthesis of Meroterpenoids Derived from Ganoderma Family 500
[Lambert-Eaton syndrome without calcium channel autoantibodies] 400
Statistical Procedures for the Medical Device Industry 400
藍からはじまる蛍光性トリプタンスリン研究 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2376151
求助须知:如何正确求助?哪些是违规求助? 2084195
关于积分的说明 5227006
捐赠科研通 1810959
什么是DOI,文献DOI怎么找? 903887
版权声明 558463
科研通“疑难数据库(出版商)”最低求助积分说明 482527