TFS-ViT: Token-level feature stylization for domain generalization

计算机科学 规范化(社会学) 安全性令牌 人工智能 一般化 卷积神经网络 特征(语言学) 模式识别(心理学) 变压器 机器学习 理论计算机科学 数学 数学分析 语言学 哲学 物理 计算机安全 量子力学 电压 社会学 人类学
作者
Mehrdad Noori,Milad Cheraghalikhani,Ali Bahri,Gustavo A. Vargas Hakim,David Osowiechi,Ismail Ben Ayed,Christian Desrosiers
出处
期刊:Pattern Recognition [Elsevier BV]
卷期号:149: 110213-110213
标识
DOI:10.1016/j.patcog.2023.110213
摘要

Standard deep learning models such as convolutional neural networks (CNNs) lack the ability of generalizing to domains which have not been seen during training. This problem is mainly due to the common but often wrong assumption of such models that the source and target data come from the same i.i.d. distribution. Recently, Vision Transformers (ViTs) have shown outstanding performance for a broad range of computer vision tasks. However, very few studies have investigated their ability to generalize to new domains. This paper presents a first Token-level Feature Stylization (TFS-ViT) approach for domain generalization, which improves the performance of ViTs to unseen data by synthesizing new domains. Our approach transforms token features by mixing the normalization statistics of images from different domains. We further improve this approach with a novel strategy for attention-aware stylization, which uses the attention maps of class (CLS) tokens to compute and mix normalization statistics of tokens corresponding to different image regions. The proposed method is flexible to the choice of backbone model and can be easily applied to any ViT-based architecture with a negligible increase in computational complexity. Comprehensive experiments show that our approach is able to achieve state-of-the-art performance on five challenging benchmarks for domain generalization, and demonstrate its ability to deal with different types of domain shifts. The implementation is available at this repository.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
FCL完成签到,获得积分10
刚刚
4秒前
端庄洪纲完成签到 ,获得积分0
7秒前
阿梨完成签到 ,获得积分10
7秒前
重重重飞完成签到 ,获得积分10
8秒前
金碧辉煌素质高完成签到 ,获得积分10
10秒前
任迷迷完成签到 ,获得积分10
14秒前
19秒前
如意的小鸭子完成签到 ,获得积分10
28秒前
任性的冷荷完成签到,获得积分10
31秒前
单纯无声完成签到 ,获得积分10
32秒前
端庄问芙完成签到 ,获得积分10
34秒前
androabo完成签到,获得积分10
34秒前
荣幸完成签到 ,获得积分10
36秒前
荀煜祺完成签到,获得积分10
39秒前
七QI完成签到 ,获得积分10
46秒前
jason完成签到 ,获得积分10
47秒前
小莫完成签到 ,获得积分10
53秒前
54秒前
Leo完成签到 ,获得积分10
55秒前
长毛象完成签到 ,获得积分10
58秒前
SCINEXUS完成签到,获得积分0
1分钟前
葱饼完成签到 ,获得积分10
1分钟前
1分钟前
1分钟前
深情安青应助科研通管家采纳,获得10
1分钟前
1分钟前
Akim应助科研通管家采纳,获得10
1分钟前
青水完成签到 ,获得积分10
1分钟前
1分钟前
harden9159完成签到,获得积分10
1分钟前
1分钟前
1分钟前
1分钟前
1分钟前
兴在路上发布了新的文献求助10
1分钟前
梦梦完成签到 ,获得积分10
1分钟前
勋出色完成签到,获得积分10
1分钟前
wangyue1230完成签到,获得积分10
1分钟前
兴在路上完成签到,获得积分10
1分钟前
高分求助中
Principles of Economics, 11th Edition 10000
Prescott's Microbiology: 2026 Release ISE 10000
University Physics with Modern Physics, 16th edition 10000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Environmental Leverage in Times of Climate Crisis: Product Standards, Carbon Border Measures and Preferential Trade Agreements 1000
Erwählung und Berufung bei Paulus: Bedeutung, Entwicklung und Funktion einer Vorstellung in ihrem frühjüdischen und griechisch-römischen Kontext 850
Matrix Methods in Data Mining and Pattern Recognition 510
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 内科学 物理 复合材料 催化作用 细胞生物学 无机化学 光电子学 物理化学 电极 基因
热门帖子
关注 科研通微信公众号,转发送积分 7204269
求助须知:如何正确求助?哪些是违规求助? 8838112
关于积分的说明 18651840
捐赠科研通 6850698
什么是DOI,文献DOI怎么找? 3180150
关于科研通互助平台的介绍 2338227
邀请新用户注册赠送积分活动 2154576