Distilling Self-Supervised Vision Transformers for Weakly-Supervised Few-Shot Classification & Segmentation

人工智能 分割 计算机科学 像素 基本事实 模式识别(心理学) 变压器 帕斯卡(单位) 计算机视觉 安全性令牌 图像分割 一次性 工程类 机械工程 计算机安全 电压 电气工程 程序设计语言
作者
Dahyun Kang,Piotr Koniusz,Minsu Cho,Naila Murray
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2307.03407
摘要

We address the task of weakly-supervised few-shot image classification and segmentation, by leveraging a Vision Transformer (ViT) pretrained with self-supervision. Our proposed method takes token representations from the self-supervised ViT and leverages their correlations, via self-attention, to produce classification and segmentation predictions through separate task heads. Our model is able to effectively learn to perform classification and segmentation in the absence of pixel-level labels during training, using only image-level labels. To do this it uses attention maps, created from tokens generated by the self-supervised ViT backbone, as pixel-level pseudo-labels. We also explore a practical setup with ``mixed" supervision, where a small number of training images contains ground-truth pixel-level labels and the remaining images have only image-level labels. For this mixed setup, we propose to improve the pseudo-labels using a pseudo-label enhancer that was trained using the available ground-truth pixel-level labels. Experiments on Pascal-5i and COCO-20i demonstrate significant performance gains in a variety of supervision settings, and in particular when little-to-no pixel-level labels are available.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
yc发布了新的文献求助10
刚刚
Hello应助warrior采纳,获得10
1秒前
TK发布了新的文献求助10
1秒前
liang发布了新的文献求助10
2秒前
cosmos完成签到,获得积分10
3秒前
3秒前
Hao应助科研通管家采纳,获得10
3秒前
小二郎应助科研通管家采纳,获得10
3秒前
Ava应助科研通管家采纳,获得10
4秒前
4秒前
wanci应助科研通管家采纳,获得10
4秒前
丹霞应助科研通管家采纳,获得10
4秒前
JamesPei应助科研通管家采纳,获得10
4秒前
我是老大应助科研通管家采纳,获得10
4秒前
4秒前
SciGPT应助科研通管家采纳,获得10
4秒前
Gyaz发布了新的文献求助10
4秒前
mineral发布了新的文献求助10
4秒前
5秒前
动脉血气分析完成签到,获得积分10
5秒前
华仔应助yc采纳,获得10
6秒前
SOLOMON应助研友_Lmbz1n采纳,获得10
6秒前
liwai完成签到,获得积分10
10秒前
10秒前
储w发布了新的文献求助10
10秒前
11秒前
mineral完成签到,获得积分10
13秒前
Cynthia完成签到 ,获得积分10
14秒前
14秒前
wh发布了新的文献求助10
17秒前
19秒前
21秒前
单薄水星发布了新的文献求助10
21秒前
fane完成签到,获得积分10
21秒前
yycc完成签到,获得积分10
21秒前
23秒前
23秒前
wh完成签到,获得积分10
24秒前
homer发布了新的文献求助10
25秒前
SOLOMON应助yg采纳,获得20
25秒前
高分求助中
请在求助之前详细阅读求助说明!!!! 20000
The Three Stars Each: The Astrolabes and Related Texts 900
Yuwu Song, Biographical Dictionary of the People's Republic of China 700
Multifunctional Agriculture, A New Paradigm for European Agriculture and Rural Development 600
Bernd Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
A radiographic standard of reference for the growing knee 400
Glossary of Geology 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2475684
求助须知:如何正确求助?哪些是违规求助? 2140241
关于积分的说明 5454157
捐赠科研通 1863619
什么是DOI,文献DOI怎么找? 926468
版权声明 562846
科研通“疑难数据库(出版商)”最低求助积分说明 495669