Dynamic DETR: End-to-End Object Detection with Dynamic Attention

编码器 端到端原则 计算机科学 变压器 特征学习 模式识别(心理学) 人工智能 电压 工程类 操作系统 电气工程
作者
Xiyang Dai,Yinpeng Chen,Jianwei Yang,Pengchuan Zhang,Yuan Liu,Lei Zhang
标识
DOI:10.1109/iccv48922.2021.00298
摘要

In this paper, we present a novel Dynamic DETR (Detection with Transformers) approach by introducing dynamic attentions into both the encoder and decoder stages of DETR to break its two limitations on small feature resolution and slow training convergence. To address the first limitation, which is due to the quadratic computational complexity of the self-attention module in Transformer encoders, we propose a dynamic encoder to approximate the Transformer encoder’s attention mechanism using a convolution-based dynamic encoder with various attention types. Such an encoder can dynamically adjust attentions based on multiple factors such as scale importance, spatial importance, and representation (i.e., feature dimension) importance. To mitigate the second limitation of learning difficulty, we introduce a dynamic decoder by replacing the cross-attention module with a ROI-based dynamic attention in the Transformer decoder. Such a decoder effectively assists Transformers to focus on region of interests from a coarse-to-fine manner and dramatically lowers the learning difficulty, leading to a much faster convergence with fewer training epochs. We conduct a series of experiments to demonstrate our advantages. Our Dynamic DETR significantly reduces the training epochs (by 14×), yet results in a much better performance (by 3.6 on mAP). Meanwhile, in the standard 1× setup with ResNet-50 backbone, we archive a new state-of-the-art performance that further proves the learning effectiveness of the proposed approach.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
汉堡包应助斑马睡不着采纳,获得10
刚刚
陈老板完成签到,获得积分10
1秒前
1秒前
大模型应助xingstar采纳,获得10
1秒前
平常的擎宇完成签到,获得积分10
3秒前
smile完成签到 ,获得积分10
3秒前
kkkk1004完成签到,获得积分10
4秒前
木木完成签到 ,获得积分10
4秒前
不要酸橘子完成签到,获得积分20
6秒前
6秒前
7秒前
纯真以晴完成签到,获得积分10
8秒前
ju龙哥发布了新的文献求助10
11秒前
xingstar发布了新的文献求助10
11秒前
Gakay完成签到,获得积分10
12秒前
缥缈易烟完成签到 ,获得积分10
14秒前
MrFamous完成签到,获得积分10
14秒前
Maybe完成签到,获得积分10
15秒前
15秒前
zzzyk发布了新的文献求助10
17秒前
17秒前
Quiller.Wang完成签到,获得积分10
17秒前
123发布了新的文献求助10
21秒前
犹豫誉发布了新的文献求助10
22秒前
传奇3应助zhang采纳,获得10
22秒前
23秒前
Meril完成签到,获得积分10
23秒前
darcy完成签到,获得积分10
24秒前
Cloud完成签到,获得积分10
25秒前
Yurrrrt完成签到,获得积分10
26秒前
小太阳完成签到,获得积分10
26秒前
weiwei发布了新的文献求助10
27秒前
菜的离谱完成签到,获得积分10
28秒前
zzzyk完成签到,获得积分10
28秒前
打打应助123采纳,获得10
28秒前
29秒前
29秒前
benben应助Mipe采纳,获得10
29秒前
犹豫誉完成签到,获得积分20
30秒前
24发布了新的文献求助10
30秒前
高分求助中
The three stars each: the Astrolabes and related texts 1100
Sport in der Antike 800
De arte gymnastica. The art of gymnastics 600
Berns Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
Stephen R. Mackinnon - Chen Hansheng: China’s Last Romantic Revolutionary (2023) 500
Sport in der Antike Hardcover – March 1, 2015 500
Psychological Warfare Operations at Lower Echelons in the Eighth Army, July 1952 – July 1953 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2431299
求助须知:如何正确求助?哪些是违规求助? 2114757
关于积分的说明 5362672
捐赠科研通 1842622
什么是DOI,文献DOI怎么找? 917055
版权声明 561539
科研通“疑难数据库(出版商)”最低求助积分说明 490548