Dissecting Chain-of-Thought: Compositionality through In-Context Filtering and Learning

组合性原则 计算机科学 人工智能 感知器 背景(考古学) 功能(生物学) 认知科学 变压器 机器学习 过程(计算) 人工神经网络 心理学 程序设计语言 工程类 生物 电气工程 进化生物学 电压 古生物学
作者
Yingcong Li,Kartik K. Sreenivasan,Angeliki Giannou,Dimitris Papailiopoulos,Samet Oymak
出处
期刊:Cornell University - arXiv 被引量:1
标识
DOI:10.48550/arxiv.2305.18869
摘要

Chain-of-thought (CoT) is a method that enables language models to handle complex reasoning tasks by decomposing them into simpler steps. Despite its success, the underlying mechanics of CoT are not yet fully understood. In an attempt to shed light on this, our study investigates the impact of CoT on the ability of transformers to in-context learn a simple to study, yet general family of compositional functions: multi-layer perceptrons (MLPs). In this setting, we find that the success of CoT can be attributed to breaking down in-context learning of a compositional function into two distinct phases: focusing on and filtering data related to each step of the composition and in-context learning the single-step composition function. Through both experimental and theoretical evidence, we demonstrate how CoT significantly reduces the sample complexity of in-context learning (ICL) and facilitates the learning of complex functions that non-CoT methods struggle with. Furthermore, we illustrate how transformers can transition from vanilla in-context learning to mastering a compositional function with CoT by simply incorporating additional layers that perform the necessary data-filtering for CoT via the attention mechanism. In addition to these test-time benefits, we show CoT helps accelerate pretraining by learning shortcuts to represent complex functions and filtering plays an important role in this process. These findings collectively provide insights into the mechanics of CoT, inviting further investigation of its role in complex reasoning tasks.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
ybheart完成签到,获得积分0
1秒前
吉吉完成签到,获得积分10
5秒前
风吹而过完成签到 ,获得积分10
8秒前
凡凡完成签到,获得积分10
11秒前
橙子发布了新的文献求助30
11秒前
聪明的二休完成签到,获得积分10
16秒前
穿山的百足公主完成签到 ,获得积分10
23秒前
邓佳鑫Alan应助钢铁侠2采纳,获得10
25秒前
穆奕完成签到 ,获得积分10
28秒前
aeolianbells完成签到 ,获得积分10
28秒前
我不是哪吒完成签到 ,获得积分10
29秒前
记忆过去完成签到 ,获得积分10
29秒前
阳光的Kelly完成签到 ,获得积分10
30秒前
液晶屏99完成签到,获得积分10
30秒前
ElaineXU完成签到 ,获得积分10
30秒前
吴谷杂粮完成签到 ,获得积分10
34秒前
34秒前
星沉静默发布了新的文献求助10
37秒前
鲁卓林完成签到,获得积分10
39秒前
多少完成签到,获得积分10
41秒前
黑大侠完成签到 ,获得积分0
41秒前
超越俗尘完成签到,获得积分10
43秒前
默默莫莫完成签到 ,获得积分10
44秒前
sadh2完成签到 ,获得积分10
49秒前
冷静的小虾米完成签到 ,获得积分10
51秒前
钢铁侠2完成签到,获得积分10
55秒前
赤子心i完成签到 ,获得积分10
59秒前
沙脑完成签到 ,获得积分10
1分钟前
ymxlcfc完成签到 ,获得积分10
1分钟前
健壮可冥完成签到 ,获得积分10
1分钟前
Akim应助科研通管家采纳,获得10
1分钟前
隐形曼青应助科研通管家采纳,获得10
1分钟前
CipherSage应助科研通管家采纳,获得10
1分钟前
爆米花应助科研通管家采纳,获得10
1分钟前
今后应助科研通管家采纳,获得10
1分钟前
1分钟前
molihuakai应助科研通管家采纳,获得10
1分钟前
丘比特应助科研通管家采纳,获得10
1分钟前
小马甲应助科研通管家采纳,获得10
1分钟前
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Cambridge History of China: Volume 4, Sui and T'ang China, 589–906 AD, Part Two 1500
Cowries - A Guide to the Gastropod Family Cypraeidae 1200
Quality by Design - An Indispensable Approach to Accelerate Biopharmaceutical Product Development 800
Pulse width control of a 3-phase inverter with non sinusoidal phase voltages 777
Signals, Systems, and Signal Processing 610
Research Methods for Applied Linguistics: A Practical Guide 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6399425
求助须知:如何正确求助?哪些是违规求助? 8216040
关于积分的说明 17407956
捐赠科研通 5452750
什么是DOI,文献DOI怎么找? 2881908
邀请新用户注册赠送积分活动 1858331
关于科研通互助平台的介绍 1700339