3D-VNPU: A Flexible Accelerator for 2D/3D CNNs on FPGA

计算机科学 现场可编程门阵列 卷积(计算机科学) 卷积神经网络 计算 硬件加速 计算复杂性理论 计算科学 并行计算 维数(图论) 算法 计算机工程 计算机硬件 人工智能 人工神经网络 数学 纯数学
作者
Huipeng Deng,Jian Wang,Huafeng Ye,Shanlin Xiao,Xiangyu Meng,Zhiyi Yu
标识
DOI:10.1109/fccm51124.2021.00029
摘要

Three-dimensional convolutional neural networks (3D CNNs) have proven to be outstanding in applications such as video analysis, 3-dimension geometric data, and 3-dimension medical image diagnosis. Compared to 2D CNNs, 3D CNNs require high computational complexity to get spatio-temporal features while Winograd algorithm can significantly reduce the amount of computation. Prior works based on 3D Winograd accelerators are only applied to stride-1 convolution, however, most of the popular 3D CNNs contain stride-2 convolution layers. In this paper, we propose a novel flexible Winograd-based decomposition method (FWDM) to apply the 3D Winograd to different strides convolution. Evaluation results show that FWDM reduces computational complexity by a factor of 3.2 for C3D, 2.9 for 3D ConvNet, and 2.6 for 3D ResNet-18. Furthermore, we design a flexible computing engine to stretch the use range of the decomposition method. Coupling FWDM and computing engine, a Winograd-based, 2D/3D CNNs compatible, highly efficient, and flexible accelerator (3D-VNPU) is proposed. Finally, we demonstrate the effectiveness of 3D-VNPU on FPGA platform (Xilinx ZCU102) and achieve 1.35TOPS for C3D, 1.2TOPS for 3D ResNet-18, and 1.1TOPS for VGG-16. DSP efficiency outperforms other CNNs accelerators 2.57~15.3x compared with prior works in FPGA of C3D. Compared to GPU and CPU, our accelerator achieves improvement up to 37.9x in performance relative to CPU and 11.8x in energy efficiency relative to GPU.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
Chase完成签到,获得积分10
1秒前
等待的虔发布了新的文献求助10
2秒前
想发sci发布了新的文献求助10
2秒前
Brak完成签到 ,获得积分10
2秒前
3秒前
abbyi完成签到,获得积分10
3秒前
小鱼完成签到,获得积分10
3秒前
3秒前
3秒前
4秒前
4秒前
xr完成签到,获得积分10
5秒前
ruqinmq完成签到,获得积分10
6秒前
6秒前
科目三应助科研通管家采纳,获得10
6秒前
6秒前
丘比特应助科研通管家采纳,获得10
6秒前
科研通AI6应助科研通管家采纳,获得10
6秒前
无花果应助科研通管家采纳,获得10
6秒前
科研通AI6应助科研通管家采纳,获得10
6秒前
爱丽丝敏发布了新的文献求助10
7秒前
搜集达人应助科研通管家采纳,获得10
7秒前
老阎应助科研通管家采纳,获得30
7秒前
7秒前
那时花开应助科研通管家采纳,获得10
7秒前
7秒前
7秒前
科研通AI6应助科研通管家采纳,获得10
7秒前
小马甲应助科研通管家采纳,获得10
7秒前
那时花开应助科研通管家采纳,获得10
7秒前
wlscj应助科研通管家采纳,获得20
7秒前
二二二完成签到 ,获得积分10
7秒前
科研通AI2S应助科研通管家采纳,获得10
7秒前
7秒前
浮游应助科研通管家采纳,获得10
7秒前
研友_8Y2z0L完成签到 ,获得积分10
7秒前
wlscj应助科研通管家采纳,获得20
7秒前
乐乐应助科研通管家采纳,获得10
8秒前
赘婿应助科研通管家采纳,获得10
8秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
FUNDAMENTAL STUDY OF ADAPTIVE CONTROL SYSTEMS 500
微纳米加工技术及其应用 500
Nanoelectronics and Information Technology: Advanced Electronic Materials and Novel Devices 500
Performance optimization of advanced vapor compression systems working with low-GWP refrigerants using numerical and experimental methods 500
Constitutional and Administrative Law 500
PARLOC2001: The update of loss containment data for offshore pipelines 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5295400
求助须知:如何正确求助?哪些是违规求助? 4444944
关于积分的说明 13834942
捐赠科研通 4329343
什么是DOI,文献DOI怎么找? 2376614
邀请新用户注册赠送积分活动 1371888
关于科研通互助平台的介绍 1337169