Human-level play in the game of Diplomacy by combining language models with strategic reasoning

西塞罗 谈判 外交 计算机科学 竞赛(生物学) 强化学习 联盟 人工智能 自然语言 政治学 政治 法学 历史 生物 天文 物理 经典 生态学
作者
Anton Bakhtin,Noam Brown,Emily Dinan,Gabriele Farina,Colin Flaherty,Daniel Fried,Andrew Goff,Jonathan Gray,Hengyuan Hu,Athul Paul Jacob,Mojtaba Komeili,Karthik Konath,Minae Kwon,Adam Lerer,Mike Lewis,Alexander Miller,Sasha Mitts,Adithya Renduchintala,Stephen Roller,Dirk Rowe
出处
期刊:Science [American Association for the Advancement of Science]
卷期号:378 (6624): 1067-1074 被引量:97
标识
DOI:10.1126/science.ade9097
摘要

Despite much progress in training artificial intelligence (AI) systems to imitate human language, building agents that use language to communicate intentionally with humans in interactive environments remains a major challenge. We introduce Cicero, the first AI agent to achieve human-level performance in Diplomacy, a strategy game involving both cooperation and competition that emphasizes natural language negotiation and tactical coordination between seven players. Cicero integrates a language model with planning and reinforcement learning algorithms by inferring players' beliefs and intentions from its conversations and generating dialogue in pursuit of its plans. Across 40 games of an anonymous online Diplomacy league, Cicero achieved more than double the average score of the human players and ranked in the top 10% of participants who played more than one game.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Uniibooy完成签到 ,获得积分10
1秒前
文车完成签到,获得积分10
3秒前
3秒前
研友_X89o6n完成签到,获得积分10
13秒前
小青龙必胜完成签到,获得积分10
15秒前
Gj发布了新的文献求助10
15秒前
超级的班完成签到,获得积分10
15秒前
16秒前
jor666完成签到,获得积分10
16秒前
yukang完成签到,获得积分10
19秒前
tudouni发布了新的文献求助10
20秒前
无辜念文完成签到,获得积分10
20秒前
传奇3应助专注千琴采纳,获得30
21秒前
Vegeta完成签到 ,获得积分10
23秒前
华仔应助tudouni采纳,获得10
24秒前
如意蚂蚁完成签到,获得积分10
25秒前
柑橘完成签到 ,获得积分10
26秒前
26秒前
许愿完成签到 ,获得积分10
28秒前
echo完成签到 ,获得积分10
29秒前
大方虎完成签到 ,获得积分10
30秒前
独特的尔风完成签到,获得积分10
32秒前
tudouni完成签到,获得积分10
32秒前
SciGPT应助万灵竹采纳,获得10
33秒前
Felix完成签到,获得积分10
34秒前
快乐藤椒堡完成签到 ,获得积分10
36秒前
Joseph_LIN完成签到,获得积分10
38秒前
纪鹏飞完成签到,获得积分10
39秒前
39秒前
40秒前
弹指一挥间完成签到 ,获得积分10
41秒前
wgglegg完成签到,获得积分10
42秒前
步步发布了新的文献求助10
43秒前
wrr应助科研通管家采纳,获得10
43秒前
冰魂应助科研通管家采纳,获得10
43秒前
43秒前
科研通AI5应助科研通管家采纳,获得10
43秒前
Gj完成签到,获得积分20
45秒前
45秒前
爆米花应助一北采纳,获得10
46秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
Maneuvering of a Damaged Navy Combatant 650
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
Mixing the elements of mass customisation 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3779363
求助须知:如何正确求助?哪些是违规求助? 3324881
关于积分的说明 10220321
捐赠科研通 3040066
什么是DOI,文献DOI怎么找? 1668529
邀请新用户注册赠送积分活动 798717
科研通“疑难数据库(出版商)”最低求助积分说明 758503