Efficient Deformable ConvNets: Rethinking Dynamic and Sparse Operator for Vision Applications

加速 计算机科学 Softmax函数 人工智能 块(置换群论) 规范化(社会学) 操作员(生物学) 绩效改进 生成模型 机器学习 计算机视觉 生成语法 深度学习 并行计算 生物化学 化学 运营管理 几何学 数学 抑制因子 社会学 人类学 转录因子 经济 基因
作者
Yuwen Xiong,Zhiqi Li,Yuntao Chen,Feng Wang,Xizhou Zhu,Jiapeng Luo,Wenhai Wang,Tong Lü,Hongsheng Li,Yu Qiao,Lewei Lu,Jie Zhou,Jifeng Dai
出处
期刊:Cornell University - arXiv 被引量:1
标识
DOI:10.48550/arxiv.2401.06197
摘要

We introduce Deformable Convolution v4 (DCNv4), a highly efficient and effective operator designed for a broad spectrum of vision applications. DCNv4 addresses the limitations of its predecessor, DCNv3, with two key enhancements: 1. removing softmax normalization in spatial aggregation to enhance its dynamic property and expressive power and 2. optimizing memory access to minimize redundant operations for speedup. These improvements result in a significantly faster convergence compared to DCNv3 and a substantial increase in processing speed, with DCNv4 achieving more than three times the forward speed. DCNv4 demonstrates exceptional performance across various tasks, including image classification, instance and semantic segmentation, and notably, image generation. When integrated into generative models like U-Net in the latent diffusion model, DCNv4 outperforms its baseline, underscoring its possibility to enhance generative models. In practical applications, replacing DCNv3 with DCNv4 in the InternImage model to create FlashInternImage results in up to 80% speed increase and further performance improvement without further modifications. The advancements in speed and efficiency of DCNv4, combined with its robust performance across diverse vision tasks, show its potential as a foundational building block for future vision models.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
awen完成签到,获得积分10
刚刚
3秒前
Jason完成签到,获得积分10
3秒前
急诊守夜人完成签到 ,获得积分10
3秒前
马户的崛起完成签到,获得积分10
5秒前
Lucas应助Brave采纳,获得10
6秒前
yyyy完成签到,获得积分10
6秒前
zhangguo完成签到 ,获得积分10
9秒前
震动的听安完成签到,获得积分10
10秒前
苹果元槐完成签到 ,获得积分10
12秒前
身体健康完成签到 ,获得积分10
13秒前
xiaofenzi完成签到,获得积分10
16秒前
19秒前
plz94完成签到 ,获得积分10
20秒前
Brave完成签到,获得积分10
22秒前
任性铅笔完成签到 ,获得积分10
24秒前
伶俐的火完成签到 ,获得积分10
24秒前
Brave发布了新的文献求助10
25秒前
李健的小迷弟应助怀素采纳,获得10
26秒前
孝择完成签到 ,获得积分10
30秒前
Lijunjie完成签到,获得积分10
32秒前
无边落木完成签到,获得积分10
32秒前
David完成签到,获得积分10
37秒前
无辜的黄豆完成签到 ,获得积分10
39秒前
Sun完成签到 ,获得积分10
40秒前
a水爱科研完成签到,获得积分10
41秒前
XuNan完成签到,获得积分10
43秒前
无私代芹完成签到,获得积分10
43秒前
xiaolizi发布了新的文献求助10
44秒前
我思故我在完成签到,获得积分0
48秒前
ypres完成签到 ,获得积分10
49秒前
藤井树完成签到,获得积分10
57秒前
研友_VZG7GZ应助anlikek采纳,获得10
1分钟前
perfect完成签到 ,获得积分10
1分钟前
强强仔仔完成签到 ,获得积分10
1分钟前
孙嘉畯完成签到 ,获得积分10
1分钟前
朴实初夏完成签到 ,获得积分0
1分钟前
Cat完成签到,获得积分0
1分钟前
1分钟前
clelo完成签到 ,获得积分10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Developing Genetic Editing Tools for Lysobacter 2000
卤化钙钛矿人工突触的研究 2000
Моделирование процессов самоорганизации в кристаллообразующих системах 1000
History of U.S. Space Surveillance and Satellite Cataloging 1000
Malcolm Fraser : a biography 700
Signals, Systems, and Signal Processing 610
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6515710
求助须知:如何正确求助?哪些是违规求助? 8308720
关于积分的说明 17757625
捐赠科研通 5617688
什么是DOI,文献DOI怎么找? 2925124
邀请新用户注册赠送积分活动 1902093
关于科研通互助平台的介绍 1763468