SOTR: Segmenting Objects with Transformers

计算机科学 分割 变压器 增采样 卷积神经网络 人工智能 计算机视觉 工程类 电压 电气工程 图像(数学)
作者
Ruohao Guo,Dantong Niu,Liao Qu,Zhenbo Li
标识
DOI:10.1109/iccv48922.2021.00707
摘要

Most recent transformer-based models show impressive performance on vision tasks, even better than Convolution Neural Networks (CNN). In this work, we present a novel, flexible, and effective transformer-based model for high-quality instance segmentation. The proposed method, Segmenting Objects with TRansformers (SOTR), simplifies the segmentation pipeline, building on an alternative CNN backbone appended with two parallel subtasks: (1) predicting per-instance category via transformer and (2) dynamically generating segmentation mask with the multi-level upsampling module. SOTR can effectively extract lower-level feature representations and capture long-range context dependencies by Feature Pyramid Network (FPN) and twin transformer, respectively. Meanwhile, compared with the original transformer, the proposed twin transformer is time- and resource-efficient since only a row and a column attention are involved to encode pixels. Moreover, SOTR is easy to be incorporated with various CNN backbones and transformer model variants to make considerable improvements for the segmentation accuracy and training convergence. Extensive experiments show that our SOTR performs well on the MS COCO dataset and surpasses state-of-the-art instance segmentation approaches. We hope our simple but strong framework could serve as a preferment baseline for instance-level recognition. Our code is available at https://github.com/easton-cau/SOTR.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
沐沐发布了新的文献求助10
2秒前
空古悠浪完成签到,获得积分20
2秒前
坚强的元瑶完成签到,获得积分10
3秒前
wang完成签到,获得积分20
4秒前
ww完成签到 ,获得积分10
4秒前
xiao柒柒柒完成签到,获得积分10
5秒前
空古悠浪发布了新的文献求助10
5秒前
CZC完成签到,获得积分10
5秒前
泡泡玛卡巴卡完成签到,获得积分10
5秒前
呆萌滑板完成签到,获得积分10
5秒前
昌子骞完成签到,获得积分10
10秒前
材化小将军完成签到,获得积分10
12秒前
YTT完成签到,获得积分10
12秒前
iVANPENNY应助沐沐采纳,获得10
13秒前
tx发布了新的文献求助10
14秒前
老唐发布了新的文献求助10
16秒前
17秒前
17秒前
盼盼完成签到,获得积分10
19秒前
19秒前
chris完成签到,获得积分10
19秒前
19秒前
Lee发布了新的文献求助10
21秒前
沐沐完成签到,获得积分10
22秒前
祖之微笑发布了新的文献求助10
22秒前
23秒前
陶醉的翅膀完成签到,获得积分10
23秒前
紫真发布了新的文献求助10
23秒前
Delili发布了新的文献求助10
24秒前
652183758完成签到 ,获得积分10
25秒前
bamboo发布了新的文献求助10
25秒前
我要去头屑完成签到,获得积分20
26秒前
cleva完成签到,获得积分10
26秒前
汉堡包应助占一手采纳,获得10
27秒前
小鲤鱼关注了科研通微信公众号
28秒前
CHEM_XIE完成签到,获得积分10
28秒前
Jieyu完成签到 ,获得积分10
29秒前
29秒前
九月发布了新的文献求助10
30秒前
高分求助中
Teaching Social and Emotional Learning in Physical Education 900
Plesiosaur extinction cycles; events that mark the beginning, middle and end of the Cretaceous 800
Recherches Ethnographiques sue les Yao dans la Chine du Sud 500
Two-sample Mendelian randomization analysis reveals causal relationships between blood lipids and venous thromboembolism 500
Chinese-English Translation Lexicon Version 3.0 500
Wisdom, Gods and Literature Studies in Assyriology in Honour of W. G. Lambert 400
薩提亞模式團體方案對青年情侶輔導效果之研究 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2392082
求助须知:如何正确求助?哪些是违规求助? 2096763
关于积分的说明 5282524
捐赠科研通 1824280
什么是DOI,文献DOI怎么找? 909850
版权声明 559895
科研通“疑难数据库(出版商)”最低求助积分说明 486216