发布文献求助

亲爱的研友该休息了！由于当前在线用户较少，发布求助请尽量完整地填写文献信息，科研通机器人24小时在线，伴您度过漫漫科研夜！身体可是革命的本钱，早点休息，好梦！

OFA: Unifying Architectures, Tasks, and Modalities Through a Simple Sequence-to-Sequence Learning Framework

隐藏字幕计算机科学序列（生物学）任务（项目管理）情态动词模态（人机交互）集合（抽象数据类型）人工智能编码（集合论）图像（数学）模式简单（哲学）自然语言处理机器学习程序设计语言经济社会学化学管理高分子化学哲学认识论生物遗传学社会科学

作者

Peng Wang,Yang An,Rui Men,Junyang Lin,Shuai Bai,Zhikang Li,Jianxin Ma,Chang Zhou,Jingren Zhou,Hongxia Yang

出处

期刊：Cornell University - arXiv 日期：2022-01-01 被引量：163

链接

arxiv.org arxiv.org arxiv.org datacite.orgdoi.org

标识

DOI：10.48550/arxiv.2202.03052

摘要

In this work, we pursue a unified paradigm for multimodal pretraining to break the scaffolds of complex task/modality-specific customization. We propose OFA, a Task-Agnostic and Modality-Agnostic framework that supports Task Comprehensiveness. OFA unifies a diverse set of cross-modal and unimodal tasks, including image generation, visual grounding, image captioning, image classification, language modeling, etc., in a simple sequence-to-sequence learning framework. OFA follows the instruction-based learning in both pretraining and finetuning stages, requiring no extra task-specific layers for downstream tasks. In comparison with the recent state-of-the-art vision & language models that rely on extremely large cross-modal datasets, OFA is pretrained on only 20M publicly available image-text pairs. Despite its simplicity and relatively small-scale training data, OFA achieves new SOTAs in a series of cross-modal tasks while attaining highly competitive performances on uni-modal tasks. Our further analysis indicates that OFA can also effectively transfer to unseen tasks and unseen domains. Our code and models are publicly available at https://github.com/OFA-Sys/OFA.

求助该文献

最长约 10秒，即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

我的文献求助列表浏览历史

一分钟了解求助规则 | 捐赠本站 | 历史今天

更新

2025年影响因子查询已上线 (2025-6-18)

更新

PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台，具备全网最快的应助速度，最高的求助完成率。对每一个文献求助，科研通都将尽心尽力，给求助人一个满意的交代。

实时播报: 鬼见愁上传了应助文件

刚刚; 科研通AI2S上传了应助文件

1秒前; ambition完成签到，获得积分10

6秒前; 发C刊的人完成签到，获得积分10

7秒前; 小不完成签到，获得积分10

7秒前; MHCL完成签到，获得积分10

7秒前; Dlyar1125完成签到，获得积分10

15秒前; 搞怪冬天完成签到，获得积分20

17秒前; 科研通AI5上传了应助文件

20秒前; 是一颗大树呀发布了新的文献求助30

27秒前; 个性的饼干完成签到，获得积分10

27秒前; ED的应助被搞怪冬天采纳，获得10

29秒前; 从容芮完成签到，获得积分0

29秒前; 牛马哥完成签到，获得积分10

31秒前; 852上传了应助文件

36秒前; fly完成签到，获得积分10

37秒前; 大溺完成签到，获得积分10

38秒前; 风中的惊蛰完成签到，获得积分10

40秒前; 哭泣的猕猴桃发布了新的文献求助10

41秒前; 阿治完成签到，获得积分10

43秒前; 华仔的应助被HDrinnk采纳，获得10

43秒前; 再不洗洗睡就来不及了完成签到，获得积分10

44秒前; 爆米花上传了应助文件

45秒前; Orange的应助被凉白开采纳，获得10

48秒前; 上官若男上传了应助文件

51秒前; 无花果上传了应助文件

52秒前; itian发布了新的文献求助10

52秒前; 华仔上传了应助文件

52秒前; 想毕业的小橙子完成签到，获得积分10

53秒前; lmk完成签到，获得积分10

53秒前; Alaska发布了新的文献求助10

56秒前; 哇达西哇发布了新的文献求助10

56秒前; HDrinnk发布了新的文献求助10

57秒前; YifanWang上传了应助文件

57秒前; clhoxvpze完成签到，获得积分10

59秒前; 半城微凉上传了应助文件

1分钟前; 哭泣的猕猴桃完成签到，获得积分10

1分钟前; Min发布了新的文献求助30

1分钟前; 深情安青的应助被noob_采纳，获得10

1分钟前; jinyu完成签到，获得积分10

1分钟前

高分求助中: (禁止应助)【重要！！请各位详细阅读】【科研通的精品贴汇总】 10000; Semantics for Latin: An Introduction 1099; Biology of the Indian Stingless Bee: Tetragonula iridipennis Smith 1000; War and Peace in the Borderlands of Myanmar: The Kachin Ceasefire, 1994-2011 800; Robot-supported joining of reinforcement textiles with one-sided sewing heads 740; 2024-2030年中国石英材料行业市场竞争现状及未来趋势研判报告 500; 镇江南郊八公洞林区鸟类生态位研究 500

热门求助领域（近24小时）

热门帖子: 关注科研通微信公众号，转发送积分 4142508; 求助须知：如何正确求助？哪些是违规求助？ 3678765; 关于积分的说明 11627629; 捐赠科研通 3372390; 什么是DOI，文献DOI怎么找？ 1852347; 邀请新用户注册赠送积分活动 915140; 科研通“疑难数据库（出版商）”最低求助积分说明 829672

今日热心研友

生椰拿铁死忠粉

高兴的苞络

注：热心度 = 本日应助数 + 本日被采纳获取积分÷10

Copyright © 2020-2025 AbleSci.COM, 科研通, All Right Reserved

科研通是非营利科研互助平台，不忘初心，为科研助力

本站互助的所有文件仅供个人学习研究用，禁止任何人把求助的所得文献进行盈利或传播

皖ICP备2024041134号-1

皖公网安备34019202002308

科研通【文献互助QQ群】：如果您有特殊求助，或发布求助超过24小时未得到应助，可加群求助，群号：941272744【点击一键加群】

科研通【志愿服务QQ群】：如果您热爱文献互助，有热心愿意为更多人服务，请加入小伙伴群，点击申请加入

关注微信服务号

科研通