Run, Don't Walk: Chasing Higher FLOPS for Faster Neural Networks

失败 计算机科学 延迟(音频) 并行计算 还原(数学) 吞吐量 计算 编码(集合论) 浮点型 卷积(计算机科学) 人工神经网络 深层神经网络 计算机工程 算法 人工智能 操作系统 电信 几何学 数学 集合(抽象数据类型) 无线 程序设计语言
作者
Jierun Chen,Shiu-hong Kao,Hao He,Weipeng Zhuo,Wen Song,Chul‐Ho Lee,S.-H. Gary Chan
标识
DOI:10.1109/cvpr52729.2023.01157
摘要

To design fast neural networks, many works have been focusing on reducing the number of floating-point operations (FLOPs). We observe that such reduction in FLOPs, however, does not necessarily lead to a similar level of re-duction in latency. This mainly stems from inefficiently low floating-point operations per second (FLOPS). To achieve faster networks, we revisit popular operators and demonstrate that such low FLOPS is mainly due to frequent memory access of the operators, especially the depthwise con-volution. We hence propose a novel partial convolution (PConv) that extracts spatial features more efficiently, by cutting down redundant computation and memory access simultaneously. Building upon our PConv, we further propose FasterNet, a new family of neural networks, which attains substantially higher running speed than others on a wide range of devices, without compromising on accuracy for various vision tasks. For example, on ImageNet-lk, our tiny FasterNet-TO is 2.8×, 3.3×, and 2.4× faster than MobileViT-XXS on GPU, CPU, and ARM processors, respectively, while being 2.9% more accurate. Our large FasterNet-L achieves impressive 83.5% top-1 accuracy, on par with the emerging Swin-B, while having 36% higher inference throughput on GPU, as well as saving 37% compute time on CPU. Code is available at https://github.com/JierunChen/FasterNet.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
彭于晏应助李某人采纳,获得10
2秒前
明子完成签到 ,获得积分10
2秒前
君子一诺完成签到,获得积分10
2秒前
2秒前
BioGO完成签到,获得积分10
2秒前
3秒前
棉花梗发布了新的文献求助30
3秒前
赞赞完成签到,获得积分10
4秒前
4秒前
淡淡舞蹈完成签到,获得积分20
4秒前
5秒前
喀喀喀完成签到,获得积分10
5秒前
机灵曼青完成签到 ,获得积分10
6秒前
Shirmel完成签到,获得积分10
6秒前
朱加凤发布了新的文献求助10
6秒前
朝颜完成签到,获得积分10
6秒前
6秒前
7秒前
7秒前
畅快的小懒虫完成签到,获得积分10
7秒前
852应助罗晨采纳,获得10
7秒前
7秒前
地球发布了新的文献求助10
7秒前
大佬发布了新的文献求助10
7秒前
雪小岳完成签到,获得积分10
8秒前
8秒前
隐形曼青应助淡淡舞蹈采纳,获得10
8秒前
图林完成签到,获得积分10
8秒前
8秒前
科研通AI2S应助包容友灵采纳,获得20
8秒前
小z完成签到,获得积分10
8秒前
深情安青应助苏铭采纳,获得10
9秒前
Ava应助lian采纳,获得10
9秒前
桐桐应助热心的雁桃采纳,获得10
10秒前
科研通AI6.1应助najeeb采纳,获得10
10秒前
rong108发布了新的文献求助10
10秒前
小马同学发布了新的文献求助100
10秒前
11秒前
11秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Organometallic Chemistry of the Transition Metals 800
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
The formation of Australian attitudes towards China, 1918-1941 640
Signals, Systems, and Signal Processing 610
全相对论原子结构与含时波包动力学的理论研究--清华大学 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6441398
求助须知:如何正确求助?哪些是违规求助? 8255357
关于积分的说明 17576780
捐赠科研通 5500021
什么是DOI,文献DOI怎么找? 2900183
邀请新用户注册赠送积分活动 1877028
关于科研通互助平台的介绍 1717044