亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

PaLM-E: An Embodied Multimodal Language Model

具身认知 计算机科学 多样性(控制论) 人工智能 语言理解 语言模型 推论 模态(人机交互) 自然语言处理 机器人学 人机交互 模式 手语 机器人 语言学 社会科学 社会学 哲学
作者
Danny Driess,Fei Xia,Mehdi S. M. Sajjadi,Corey Lynch,Aakanksha Chowdhery,Brian Ichter,Ayzaan Wahid,Jonathan Tompson,Quan Vuong,Tianhe Yu,Wenlong Huang,Yevgen Chebotar,Pierre Sermanet,Daniel Duckworth,Sergey Levine,Vincent Vanhoucke,Karol Hausman,Marc Toussaint,Klaus Greff,Andy Zeng
出处
期刊:Cornell University - arXiv 被引量:271
标识
DOI:10.48550/arxiv.2303.03378
摘要

Large language models excel at a wide range of complex tasks. However, enabling general inference in the real world, e.g., for robotics problems, raises the challenge of grounding. We propose embodied language models to directly incorporate real-world continuous sensor modalities into language models and thereby establish the link between words and percepts. Input to our embodied language model are multi-modal sentences that interleave visual, continuous state estimation, and textual input encodings. We train these encodings end-to-end, in conjunction with a pre-trained large language model, for multiple embodied tasks including sequential robotic manipulation planning, visual question answering, and captioning. Our evaluations show that PaLM-E, a single large embodied multimodal model, can address a variety of embodied reasoning tasks, from a variety of observation modalities, on multiple embodiments, and further, exhibits positive transfer: the model benefits from diverse joint training across internet-scale language, vision, and visual-language domains. Our largest model, PaLM-E-562B with 562B parameters, in addition to being trained on robotics tasks, is a visual-language generalist with state-of-the-art performance on OK-VQA, and retains generalist language capabilities with increasing scale.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
努力羊羊应助爱听歌笑寒采纳,获得10
1秒前
优秀的流沙完成签到 ,获得积分10
20秒前
chenjzhuc应助爱听歌笑寒采纳,获得10
40秒前
1分钟前
车访枫发布了新的文献求助10
1分钟前
1分钟前
车访枫完成签到,获得积分10
1分钟前
挖菜发布了新的文献求助10
2分钟前
rosa完成签到,获得积分20
2分钟前
2分钟前
rosa发布了新的文献求助10
2分钟前
体贴问丝完成签到 ,获得积分10
2分钟前
酷波er应助满意的谷梦采纳,获得30
3分钟前
鲤鱼越越完成签到 ,获得积分10
3分钟前
3分钟前
3分钟前
5分钟前
5分钟前
6分钟前
Micarl发布了新的文献求助10
6分钟前
科研佟完成签到 ,获得积分10
6分钟前
Micarl完成签到,获得积分20
6分钟前
7分钟前
puzhongjiMiQ发布了新的文献求助10
7分钟前
puzhongjiMiQ发布了新的文献求助10
7分钟前
淡淡醉波wuliao完成签到 ,获得积分10
8分钟前
9分钟前
9分钟前
9分钟前
10分钟前
拓跋涵易完成签到,获得积分10
11分钟前
香蕉觅云应助科研通管家采纳,获得10
11分钟前
科研通AI5应助Marciu33采纳,获得10
11分钟前
Ava应助整齐道消采纳,获得10
11分钟前
平常的毛豆应助puzhongjiMiQ采纳,获得10
12分钟前
FashionBoy应助puzhongjiMiQ采纳,获得10
12分钟前
Accepted应助puzhongjiMiQ采纳,获得10
12分钟前
平常的毛豆应助puzhongjiMiQ采纳,获得10
12分钟前
Lucas应助puzhongjiMiQ采纳,获得10
12分钟前
orixero应助puzhongjiMiQ采纳,获得10
12分钟前
高分求助中
The world according to Garb 600
Разработка метода ускоренного контроля качества электрохромных устройств 500
Mass producing individuality 500
Chinesen in Europa – Europäer in China: Journalisten, Spione, Studenten 500
Arthur Ewert: A Life for the Comintern 500
China's Relations With Japan 1945-83: The Role of Liao Chengzhi // Kurt Werner Radtke 500
Two Years in Peking 1965-1966: Book 1: Living and Teaching in Mao's China // Reginald Hunt 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3819930
求助须知:如何正确求助?哪些是违规求助? 3362797
关于积分的说明 10418814
捐赠科研通 3081174
什么是DOI,文献DOI怎么找? 1694991
邀请新用户注册赠送积分活动 814788
科研通“疑难数据库(出版商)”最低求助积分说明 768522