No More Strided Convolutions or Pooling: A New CNN Building Block for Low-Resolution Images and Small Objects

计算机科学 联营 块(置换群论) 卷积(计算机科学) 卷积神经网络 人工智能 特征(语言学) 模式识别(心理学) 图层(电子) 对象(语法) 深度学习 计算机视觉 人工神经网络 语言学 哲学 化学 几何学 数学 有机化学
作者
Raja Sunkara,Tie Luo
出处
期刊:Lecture Notes in Computer Science 卷期号:: 443-459 被引量:559
标识
DOI:10.1007/978-3-031-26409-2_27
摘要

Convolutional neural networks (CNNs) have made resounding success in many computer vision tasks such as image classification and object detection. However, their performance degrades rapidly on tougher tasks where images are of low resolution or objects are small. In this paper, we point out that this roots in a defective yet common design in existing CNN architectures, namely the use of strided convolution and/or pooling layers, which results in a loss of fine-grained information and learning of less effective feature representations. To this end, we propose a new CNN building block called SPD-Conv in place of each strided convolution layer and each pooling layer (thus eliminates them altogether). SPD-Conv is comprised of a space-to-depth (SPD) layer followed by a non-strided convolution (Conv) layer, and can be applied in most if not all CNN architectures. We explain this new design under two most representative computer vision tasks: object detection and image classification. We then create new CNN architectures by applying SPD-Conv to YOLOv5 and ResNet, and empirically show that our approach significantly outperforms state-of-the-art deep learning models, especially on tougher tasks with low-resolution images and small objects. We have open-sourced our code at https://github.com/LabSAINT/SPD-Conv .
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

祝大家在新的一年里科研腾飞
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
3秒前
小杜发布了新的文献求助10
4秒前
5秒前
Qing完成签到,获得积分10
5秒前
1111发布了新的文献求助10
5秒前
吃猫的鱼发布了新的文献求助10
8秒前
小蘑菇应助xuan采纳,获得10
9秒前
缥缈凡旋完成签到,获得积分10
10秒前
科研通AI6.1应助sci采纳,获得10
11秒前
善良板栗发布了新的文献求助10
11秒前
搜集达人应助欢呼的傲旋采纳,获得10
13秒前
上官若男应助LZY采纳,获得10
13秒前
Horizon完成签到 ,获得积分10
14秒前
lili完成签到,获得积分10
15秒前
15秒前
友好碧完成签到 ,获得积分10
15秒前
爱听歌的悒完成签到,获得积分10
18秒前
LM完成签到,获得积分10
18秒前
19秒前
19秒前
19秒前
刘前完成签到,获得积分10
20秒前
21秒前
晓峰完成签到,获得积分10
22秒前
23秒前
王芸发布了新的文献求助10
23秒前
24秒前
给你寄春天完成签到 ,获得积分10
24秒前
the_tao完成签到,获得积分10
25秒前
26秒前
wanci应助1111采纳,获得10
26秒前
happiness完成签到 ,获得积分10
26秒前
离清歌发布了新的文献求助10
27秒前
LZY发布了新的文献求助10
28秒前
fffffr完成签到,获得积分10
28秒前
the_tao发布了新的文献求助10
29秒前
可不可以完成签到 ,获得积分10
30秒前
初步完成签到,获得积分20
30秒前
刻苦的昊强完成签到,获得积分10
31秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Les Mantodea de guyane 2500
Signals, Systems, and Signal Processing 510
Discrete-Time Signals and Systems 510
The Dance of Butch/Femme: The Complementarity and Autonomy of Lesbian Gender Identity 500
Driving under the influence: Epidemiology, etiology, prevention, policy, and treatment 500
Differentiation Between Social Groups: Studies in the Social Psychology of Intergroup Relations 350
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5876999
求助须知:如何正确求助?哪些是违规求助? 6538704
关于积分的说明 15680209
捐赠科研通 4995659
什么是DOI,文献DOI怎么找? 2692253
邀请新用户注册赠送积分活动 1634453
关于科研通互助平台的介绍 1592155