Learning a thousand tasks in a day

一般化 计算机科学 人工智能 模仿 任务(项目管理) 机器人 对象(语法) 弹道 分解 人机交互 演示式编程 学习迁移 克隆(编程) 机器学习 任务分析 机器人学 人机交互 代表(政治) 仿人机器人 内隐学习 理论(学习稳定性) 编码(内存) 视觉对象识别的认知神经科学 机器人学习 先验概率
作者
Kamil Dreczkowski,Pietro Vitiello,Vitalis Vosylius,Edward Johns
出处
期刊:Science robotics [American Association for the Advancement of Science]
卷期号:10 (108)
标识
DOI:10.1126/scirobotics.adv7594
摘要

Humans are remarkably efficient at learning tasks from demonstrations, but today’s imitation learning methods for robot manipulation often require hundreds or thousands of demonstrations per task. We investigated two fundamental priors for improving learning efficiency: decomposing manipulation trajectories into sequential alignment and interaction phases and retrieval-based generalization. Through 3450 real-world rollouts, we systematically studied this decomposition. We compared different design choices for the alignment and interaction phases and examined generalization and scaling trends relative to today’s dominant paradigm of behavioral cloning with a single-phase monolithic policy. In the few-demonstrations-per-task regime (<10 demonstrations), decomposition achieved an order of magnitude of improvement in data efficiency over single-phase learning, with retrieval consistently outperforming behavioral cloning for both alignment and interaction. Building on these insights, we developed Multi-Task Trajectory Transfer (MT3), an imitation learning method based on decomposition and retrieval. MT3 learns everyday manipulation tasks from as little as a single demonstration each while also generalizing to previously unseen object instances. This efficiency enabled us to teach a robot 1000 distinct everyday tasks in under 24 hours of human demonstrator time. Through 2200 additional real-world rollouts, we reveal MT3’s capabilities and limitations across different task families.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
lwj完成签到,获得积分10
刚刚
冷酷以太完成签到,获得积分10
1秒前
鱼祈y完成签到,获得积分10
2秒前
2秒前
周维完成签到,获得积分10
4秒前
4秒前
luoyan应助南宫采纳,获得10
5秒前
香蕉觅云应助juntang采纳,获得10
5秒前
lkkkkk发布了新的文献求助10
6秒前
老张斯基发布了新的文献求助10
8秒前
9秒前
老张斯基发布了新的文献求助10
9秒前
张吴两胜完成签到,获得积分10
9秒前
西西完成签到,获得积分10
10秒前
JONG应助qjw采纳,获得10
11秒前
科研通AI6.2应助qjw采纳,获得10
11秒前
11秒前
领导范儿应助Gao15264892采纳,获得10
11秒前
12秒前
ww2026应助zvvZB采纳,获得10
12秒前
乐乐应助SEVEN采纳,获得10
12秒前
13秒前
Yipeng98完成签到,获得积分10
14秒前
一米阳光完成签到,获得积分10
14秒前
qh完成签到,获得积分10
14秒前
户户得振完成签到,获得积分10
15秒前
15秒前
手抓饼啊发布了新的文献求助10
15秒前
15秒前
叮咚完成签到 ,获得积分10
16秒前
16秒前
17秒前
17秒前
17秒前
18秒前
湘湘发布了新的文献求助30
18秒前
小北发布了新的文献求助10
18秒前
yonglong完成签到,获得积分10
19秒前
Simon应助pure123采纳,获得20
19秒前
20秒前
高分求助中
Signals, Systems, and Signal Processing 610
Fundamentals of Pharmaceutical and Biologics Regulations: A Global Perspective, Second Edition 600
久松真一著作集〈第5巻〉禅と芸術 500
Fundamentals of Modern Mathematics: A Practical Review (Dover Books on Mathematics) 500
Cold War Transcended: Australia's China Policy, 1949-1990 470
Cybercrime: The Transformation of Crime in the Information Age, 2nd Edition 400
Moore's Clinically Oriented Anatomy 10th Edition 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6618405
求助须知:如何正确求助?哪些是违规求助? 8382670
关于积分的说明 17933146
捐赠科研通 5788529
什么是DOI,文献DOI怎么找? 2960221
邀请新用户注册赠送积分活动 1935427
关于科研通互助平台的介绍 1840456