TFS-ViT: Token-level feature stylization for domain generalization

计算机科学 规范化(社会学) 安全性令牌 人工智能 一般化 卷积神经网络 特征(语言学) 模式识别(心理学) 变压器 机器学习 理论计算机科学 数学 人类学 物理 数学分析 哲学 社会学 量子力学 语言学 电压 计算机安全
作者
Mehrdad Noori,Milad Cheraghalikhani,Ali Bahri,Gustavo A. Vargas Hakim,David Osowiechi,Ismail Ben Ayed,Christian Desrosiers
出处
期刊:Pattern Recognition [Elsevier BV]
卷期号:149: 110213-110213
标识
DOI:10.1016/j.patcog.2023.110213
摘要

Standard deep learning models such as convolutional neural networks (CNNs) lack the ability of generalizing to domains which have not been seen during training. This problem is mainly due to the common but often wrong assumption of such models that the source and target data come from the same i.i.d. distribution. Recently, Vision Transformers (ViTs) have shown outstanding performance for a broad range of computer vision tasks. However, very few studies have investigated their ability to generalize to new domains. This paper presents a first Token-level Feature Stylization (TFS-ViT) approach for domain generalization, which improves the performance of ViTs to unseen data by synthesizing new domains. Our approach transforms token features by mixing the normalization statistics of images from different domains. We further improve this approach with a novel strategy for attention-aware stylization, which uses the attention maps of class (CLS) tokens to compute and mix normalization statistics of tokens corresponding to different image regions. The proposed method is flexible to the choice of backbone model and can be easily applied to any ViT-based architecture with a negligible increase in computational complexity. Comprehensive experiments show that our approach is able to achieve state-of-the-art performance on five challenging benchmarks for domain generalization, and demonstrate its ability to deal with different types of domain shifts. The implementation is available at this repository.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
cloud完成签到,获得积分10
1秒前
刘帅完成签到,获得积分10
2秒前
neocc123完成签到 ,获得积分10
2秒前
52pry发布了新的文献求助10
3秒前
3秒前
dreamode发布了新的文献求助15
4秒前
strug783发布了新的文献求助10
4秒前
科研通AI2S应助Viviiviii采纳,获得10
5秒前
dada完成签到,获得积分10
5秒前
高兴的彩虹完成签到,获得积分10
6秒前
111111应助谦让的寄凡采纳,获得10
9秒前
锌小子完成签到,获得积分10
11秒前
11秒前
12秒前
lanxinge发布了新的文献求助20
12秒前
TYM发布了新的文献求助10
15秒前
小库的咖喱完成签到,获得积分20
17秒前
19秒前
nzhou2527发布了新的文献求助10
25秒前
科研通AI5应助秋子采纳,获得10
26秒前
雪sung发布了新的文献求助10
28秒前
搜集达人应助疯狂的荟采纳,获得10
30秒前
orixero应助科研通管家采纳,获得20
30秒前
隐形曼青应助科研通管家采纳,获得10
30秒前
HEIKU应助科研通管家采纳,获得10
31秒前
HEIKU应助科研通管家采纳,获得10
31秒前
ding应助科研通管家采纳,获得10
31秒前
田様应助科研通管家采纳,获得10
31秒前
深情安青应助科研通管家采纳,获得10
31秒前
科研通AI5应助Sunday采纳,获得10
31秒前
HEIKU应助科研通管家采纳,获得10
31秒前
充电宝应助科研通管家采纳,获得10
31秒前
31秒前
35秒前
37秒前
科研通AI2S应助小巧的映易采纳,获得10
37秒前
秋子完成签到,获得积分10
37秒前
党弛完成签到,获得积分10
41秒前
秋子发布了新的文献求助10
41秒前
科研通AI2S应助WYN采纳,获得10
42秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Encyclopedia of Geology (2nd Edition) 2000
Maneuvering of a Damaged Navy Combatant 650
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
Mixing the elements of mass customisation 300
the MD Anderson Surgical Oncology Manual, Seventh Edition 300
Nucleophilic substitution in azasydnone-modified dinitroanisoles 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3780310
求助须知:如何正确求助?哪些是违规求助? 3325580
关于积分的说明 10223667
捐赠科研通 3040766
什么是DOI,文献DOI怎么找? 1668988
邀请新用户注册赠送积分活动 798962
科研通“疑难数据库(出版商)”最低求助积分说明 758648