亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Evaluating and Enhancing LLMs Agent based on Theory of Mind in Guandan: A Multi-Player Cooperative Game under Imperfect Information

不完美的 完美信息 博弈论 计算机科学 经济 微观经济学 心理学 哲学 语言学
作者
Yauwai Yim,Chunkit Chan,Tianyu Shi,Zheye Deng,Wei Fan,Tongxin Zheng,Yangqiu Song
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2408.02559
摘要

Large language models (LLMs) have shown success in handling simple games with imperfect information and enabling multi-agent coordination, but their ability to facilitate practical collaboration against other agents in complex, imperfect information environments, especially in a non-English environment, still needs to be explored. This study investigates the applicability of knowledge acquired by open-source and API-based LLMs to sophisticated text-based games requiring agent collaboration under imperfect information, comparing their performance to established baselines using other types of agents. We propose a Theory of Mind (ToM) planning technique that allows LLM agents to adapt their strategy against various adversaries using only game rules, current state, and historical context as input. An external tool was incorporated to mitigate the challenge of dynamic and extensive action spaces in this card game. Our results show that although a performance gap exists between current LLMs and state-of-the-art reinforcement learning (RL) models, LLMs demonstrate ToM capabilities in this game setting. It consistently improves their performance against opposing agents, suggesting their ability to understand the actions of allies and adversaries and establish collaboration with allies. To encourage further research and understanding, we have made our codebase openly accessible.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
HFH举报123求助涉嫌违规
26秒前
奋进的熊完成签到,获得积分10
58秒前
22完成签到,获得积分10
1分钟前
今后应助芳菲采纳,获得10
1分钟前
1分钟前
1分钟前
芳菲发布了新的文献求助10
1分钟前
ayayaya完成签到 ,获得积分10
2分钟前
嗨皮牙完成签到 ,获得积分10
2分钟前
HFH给豆沙包789的求助进行了留言
2分钟前
开心惜梦完成签到,获得积分10
2分钟前
宝可梦大师完成签到,获得积分10
2分钟前
2分钟前
优秀丹南完成签到,获得积分10
3分钟前
3分钟前
优秀丹南发布了新的文献求助20
3分钟前
depravity完成签到 ,获得积分10
3分钟前
井盖猪头笨蛋完成签到 ,获得积分10
4分钟前
薤白完成签到 ,获得积分10
4分钟前
5分钟前
说话的月亮完成签到,获得积分10
5分钟前
5分钟前
369ninja应助科研通管家采纳,获得10
5分钟前
汉堡包应助科研通管家采纳,获得10
5分钟前
梦梦梦发布了新的文献求助10
5分钟前
22发布了新的文献求助20
5分钟前
搜集达人应助梦梦梦采纳,获得10
5分钟前
6分钟前
无情白猫发布了新的文献求助10
6分钟前
小西西完成签到,获得积分10
6分钟前
无情白猫完成签到,获得积分10
6分钟前
AllRightReserved应助无情白猫采纳,获得10
6分钟前
852应助科研通管家采纳,获得10
7分钟前
上官若男应助科研通管家采纳,获得10
7分钟前
7分钟前
7分钟前
7分钟前
深情安青应助科研通管家采纳,获得10
7分钟前
7分钟前
7分钟前
高分求助中
The Graphene Handbook (2019 Edition) 800
IEST-RP-CC018: Cleanroom Cleaning and Sanitization: Operating and Monitoring Procedures 600
Fundamentals of Pharmaceutical and Biologics Regulations: A Global Perspective, Second Edition 600
久松真一著作集〈第5巻〉禅と芸術 500
Fundamentals of Modern Mathematics: A Practical Review (Dover Books on Mathematics) 500
Cold War Transcended: Australia's China Policy, 1949-1990 470
Comprehensive Organic Synthesis 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6590960
求助须知:如何正确求助?哪些是违规求助? 8362999
关于积分的说明 17905632
捐赠科研通 5737857
什么是DOI,文献DOI怎么找? 2951311
邀请新用户注册赠送积分活动 1926648
关于科研通互助平台的介绍 1816437