已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Unsupervised Prototype Adapter for Vision-Language Models

计算机科学 适配器(计算) 杠杆(统计) 人工智能 可扩展性 初始化 语言模型 机器学习 计算机视觉 计算机硬件 数据库 程序设计语言
作者
Yi Zhang,Ce Zhang,Xueqiang Hu,Zhihai He
出处
期刊:Lecture Notes in Computer Science 卷期号:: 197-209
标识
DOI:10.1007/978-981-99-8429-9_16
摘要

Recently, large-scale pre-trained vision-language models (e.g. CLIP and ALIGN) have demonstrated remarkable effectiveness in acquiring transferable visual representations. To leverage the valuable knowledge encoded within these models for downstream tasks, several fine-tuning approaches, including prompt tuning methods and adapter-based methods, have been developed to adapt vision-language models effectively with supervision. However, these methods rely on the availability of annotated samples, which can be labor-intensive and time-consuming to acquire, thus limiting scalability. To address this issue, in this work, we design an unsupervised fine-tuning approach for vision-language models called Unsupervised Prototype Adapter (UP-Adapter). Specifically, for the unannotated target datasets, we leverage the text-image aligning capability of CLIP to automatically select the most confident samples for each class. Utilizing these selected samples, we generate class prototypes, which serve as the initialization for the learnable prototype model. After fine-tuning, the prototype model prediction is combined with the original CLIP’s prediction by a residual connection to perform downstream recognition tasks. Our extensive experimental results on image recognition and domain generalization show that the proposed unsupervised method outperforms 8-shot CoOp, 8-shot Tip-Adapter, and also the state-of-the-art UPL method by large margins.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
夏雪冬花发布了新的文献求助10
3秒前
4秒前
斯文败类应助耗尽采纳,获得10
5秒前
Bobby完成签到 ,获得积分0
6秒前
6秒前
9秒前
菠萝吹雪发布了新的文献求助10
10秒前
夏雪冬花完成签到,获得积分10
12秒前
123完成签到,获得积分10
12秒前
沟里的水草精完成签到,获得积分10
13秒前
13秒前
明亮夕阳完成签到,获得积分10
15秒前
鲤鱼晓博完成签到 ,获得积分10
18秒前
柚子完成签到 ,获得积分10
18秒前
Owen应助一只碴采纳,获得10
18秒前
意忆发布了新的文献求助10
18秒前
草拟大坝应助一只碴采纳,获得10
18秒前
dyfsj发布了新的文献求助10
19秒前
斯文败类应助ddfrog采纳,获得10
21秒前
22秒前
小二郎应助沟里的水草精采纳,获得10
23秒前
29秒前
29秒前
汉堡包应助dyfsj采纳,获得10
30秒前
我是老大应助Mr.Ren采纳,获得10
32秒前
O泡果奶完成签到 ,获得积分10
34秒前
35秒前
38秒前
39秒前
活泼的狗发布了新的文献求助10
43秒前
姜灭绝发布了新的文献求助10
44秒前
毛毛发布了新的文献求助10
45秒前
SciGPT应助ye_hang采纳,获得80
48秒前
49秒前
小赵完成签到 ,获得积分10
50秒前
在水一方应助峰峰采纳,获得10
51秒前
Mr.Ren发布了新的文献求助10
55秒前
Owen应助pigzhu采纳,获得10
58秒前
生生世世完成签到 ,获得积分10
1分钟前
高分求助中
Manual of Clinical Microbiology, 4 Volume Set (ASM Books) 13th Edition 1000
Edestus (Chondrichthyes, Elasmobranchii) from the Upper Carboniferous of Xinjiang, China 500
Chinese-English Translation Lexicon Version 3.0 500
Electronic Structure Calculations and Structure-Property Relationships on Aromatic Nitro Compounds 500
マンネンタケ科植物由来メロテルペノイド類の網羅的全合成/Collective Synthesis of Meroterpenoids Derived from Ganoderma Family 500
Two-sample Mendelian randomization analysis reveals causal relationships between blood lipids and venous thromboembolism 400
薩提亞模式團體方案對青年情侶輔導效果之研究 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2380796
求助须知:如何正确求助?哪些是违规求助? 2088072
关于积分的说明 5243674
捐赠科研通 1815145
什么是DOI,文献DOI怎么找? 905666
版权声明 558810
科研通“疑难数据库(出版商)”最低求助积分说明 483589