亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Oscar: Object-Semantics Aligned Pre-training for Vision-Language Tasks

计算机科学 语义学(计算机科学) 人工智能 图像(数学) 自然语言处理 对象(语法) 编码(集合论) 突出 计算机视觉 程序设计语言 集合(抽象数据类型)
作者
Xiujun Li,Xi Yin,Chunyuan Li,Pengchuan Zhang,Xiaowei Hu,Lei Zhang,Limin Wang,Houdong Hu,Li Dong,Furu Wei,Yejin Choi,Jianfeng Gao
出处
期刊:Lecture Notes in Computer Science 卷期号:: 121-137 被引量:679
标识
DOI:10.1007/978-3-030-58577-8_8
摘要

Large-scale pre-training methods of learning cross-modal representations on image-text pairs are becoming popular for vision-language tasks. While existing methods simply concatenate image region features and text features as input to the model to be pre-trained and use self-attention to learn image-text semantic alignments in a brute force manner, in this paper, we propose a new learning method Oscar (Object-Semantics Aligned Pre-training), which uses object tags detected in images as anchor points to significantly ease the learning of alignments. Our method is motivated by the observation that the salient objects in an image can be accurately detected, and are often mentioned in the paired text. We pre-train an Oscar model on the public corpus of 6.5 million text-image pairs, and fine-tune it on downstream tasks, creating new state-of-the-arts on six well-established vision-language understanding and generation tasks (The code and pre-trained models are released: https://github.com/microsoft/Oscar).
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
外向静芙发布了新的文献求助10
5秒前
乐乐应助珂珂子采纳,获得10
13秒前
今后应助外向静芙采纳,获得10
15秒前
18秒前
杨昊完成签到 ,获得积分20
19秒前
詹成宇发布了新的文献求助10
41秒前
spricity完成签到,获得积分10
47秒前
东郭源智完成签到,获得积分20
52秒前
53秒前
1分钟前
沙沙完成签到 ,获得积分10
1分钟前
在水一方应助ywl采纳,获得10
1分钟前
1分钟前
浩浩大人发布了新的文献求助10
1分钟前
nns完成签到,获得积分10
1分钟前
1分钟前
1分钟前
ding应助asgfds采纳,获得10
1分钟前
寻道图强应助nns采纳,获得20
1分钟前
1分钟前
ywl发布了新的文献求助10
1分钟前
1分钟前
1分钟前
阿涵发布了新的文献求助10
1分钟前
Lamis完成签到 ,获得积分10
1分钟前
cherry发布了新的文献求助10
1分钟前
1分钟前
小饼饼完成签到,获得积分10
1分钟前
tmw发布了新的文献求助10
1分钟前
2分钟前
背后的乐萱完成签到,获得积分10
2分钟前
aass发布了新的文献求助10
2分钟前
有点菜完成签到 ,获得积分10
2分钟前
aass完成签到,获得积分10
2分钟前
快哒哒哒发布了新的文献求助10
2分钟前
scott910806完成签到,获得积分10
2分钟前
最最可爱发布了新的文献求助20
2分钟前
源源源完成签到 ,获得积分10
2分钟前
2分钟前
夫诸完成签到 ,获得积分10
2分钟前
高分求助中
Un calendrier babylonien des travaux, des signes et des mois: Séries iqqur îpuš 1036
Quantum Science and Technology Volume 5 Number 4, October 2020 1000
Formgebungs- und Stabilisierungsparameter für das Konstruktionsverfahren der FiDU-Freien Innendruckumformung von Blech 1000
IG Farbenindustrie AG and Imperial Chemical Industries Limited strategies for growth and survival 1925-1953 800
Sustainable Land Management: Strategies to Cope with the Marginalisation of Agriculture 600
Prochinois Et Maoïsmes En France (et Dans Les Espaces Francophones) 500
Offline version of the Proceedings of 15th EWTEC 2023, Bilbao 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2524109
求助须知:如何正确求助?哪些是违规求助? 2166317
关于积分的说明 5556604
捐赠科研通 1886473
什么是DOI,文献DOI怎么找? 939367
版权声明 564557
科研通“疑难数据库(出版商)”最低求助积分说明 501028