ReAct: Synergizing Reasoning and Acting in Language Models

计算机科学 可解释性 背景(考古学) 动作(物理) 任务(项目管理) 模仿 人工智能 语言模型 自然语言处理 认知科学 人机交互 心理学 管理 经济 古生物学 物理 生物 社会心理学 量子力学
作者
Shunyu Yao,Jeffrey Zhao,Dian Yu,Nan Du,Izhak Shafran,Karthik Narasimhan,Yuan Cao
出处
期刊:Cornell University - arXiv 被引量:495
标识
DOI:10.48550/arxiv.2210.03629
摘要

While large language models (LLMs) have demonstrated impressive capabilities across tasks in language understanding and interactive decision making, their abilities for reasoning (e.g. chain-of-thought prompting) and acting (e.g. action plan generation) have primarily been studied as separate topics. In this paper, we explore the use of LLMs to generate both reasoning traces and task-specific actions in an interleaved manner, allowing for greater synergy between the two: reasoning traces help the model induce, track, and update action plans as well as handle exceptions, while actions allow it to interface with external sources, such as knowledge bases or environments, to gather additional information. We apply our approach, named ReAct, to a diverse set of language and decision making tasks and demonstrate its effectiveness over state-of-the-art baselines, as well as improved human interpretability and trustworthiness over methods without reasoning or acting components. Concretely, on question answering (HotpotQA) and fact verification (Fever), ReAct overcomes issues of hallucination and error propagation prevalent in chain-of-thought reasoning by interacting with a simple Wikipedia API, and generates human-like task-solving trajectories that are more interpretable than baselines without reasoning traces. On two interactive decision making benchmarks (ALFWorld and WebShop), ReAct outperforms imitation and reinforcement learning methods by an absolute success rate of 34% and 10% respectively, while being prompted with only one or two in-context examples. Project site with code: https://react-lm.github.io
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
含糊的寻雪完成签到,获得积分20
2秒前
微风完成签到 ,获得积分10
2秒前
量子星尘发布了新的文献求助10
2秒前
dy发布了新的文献求助10
4秒前
4秒前
CodeCraft应助神明采纳,获得10
5秒前
Lucas应助czn0523采纳,获得10
5秒前
7秒前
杏子完成签到,获得积分10
7秒前
王红坤完成签到,获得积分10
8秒前
花里胡哨的花完成签到,获得积分10
9秒前
微笑完成签到,获得积分10
10秒前
10秒前
10秒前
赘婿应助Sweet采纳,获得30
11秒前
深情安青应助mmmxxxjjj采纳,获得10
11秒前
小粒橙发布了新的文献求助10
13秒前
哦啦啦发布了新的文献求助10
14秒前
15秒前
Emma完成签到 ,获得积分10
15秒前
超级蘑菇发布了新的文献求助30
17秒前
18秒前
Vresty完成签到,获得积分10
19秒前
shukq发布了新的文献求助10
20秒前
21秒前
dihaha完成签到,获得积分10
24秒前
量子星尘发布了新的文献求助10
25秒前
深情安青应助研友_ndvmV8采纳,获得10
26秒前
avalanche应助能干的初瑶采纳,获得30
26秒前
大白菜发布了新的文献求助10
26秒前
26秒前
pass发布了新的文献求助10
27秒前
27秒前
Gzl完成签到 ,获得积分10
28秒前
29秒前
29秒前
王WW发布了新的文献求助10
30秒前
32秒前
神明发布了新的文献求助10
33秒前
yq发布了新的文献求助10
34秒前
高分求助中
Aerospace Standards Index - 2025 10000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
EEG in Childhood Epilepsy: Initial Presentation & Long-Term Follow-Up 1000
Clinical Microbiology Procedures Handbook, Multi-Volume, 5th Edition 1000
List of 1,091 Public Pension Profiles by Region 981
流动的新传统主义与新生代农民工的劳动力再生产模式变迁 500
Elements of Evolutionary Genetics 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5453630
求助须知:如何正确求助?哪些是违规求助? 4561192
关于积分的说明 14281077
捐赠科研通 4485153
什么是DOI,文献DOI怎么找? 2456502
邀请新用户注册赠送积分活动 1447252
关于科研通互助平台的介绍 1422669