Fully Pipelined FPGA Acceleration of Binary Convolutional Neural Networks with Neural Architecture Search

现场可编程门阵列 卷积神经网络 计算机科学 人工神经网络 建筑 二进制数 加速度 计算机体系结构 并行计算 硬件加速 嵌入式系统 计算机硬件 人工智能 算术 数学 艺术 物理 经典力学 视觉艺术
作者
Mengfei Ji,Zaid Al-Ars,Yuchun Chang,Bao‐Lin Zhang
出处
期刊:Journal of Circuits, Systems, and Computers [World Scientific]
卷期号:33 (10)
标识
DOI:10.1142/s0218126624501706
摘要

In this paper, we present a fully pipelined and semi-parallel channel convolutional neural network hardware accelerator structure. This structure can trade off the compute time and the hardware utilization, allowing the accelerator to be layer pipelined without the need for fully parallelizing the input and output channels. A parallel strategy is applied to reduce the time gap in transferring the output results between different layers. The parallelism can be decided based on the hardware resources on the target FPGA. We use this structure to implement a binary ResNet18 based on the neural architecture search strategy, which can increase the accuracy of manually designed binary convolutional neural networks. Our optimized binary ResNet18 can achieve a Top-1 accuracy of 60.5% on the ImageNet dataset. We deploy this ResNet18 hardware implementation on an Alphadata 9H7 FPGA, connected with an OpenCAPI interface, to demonstrate the hardware capabilities. Depending on the amount of parallelism used, the latency can range from 1.12 to 6.33 ms, with a corresponding throughput of 4.56 to 0.71 TOPS for different hardware utilization, with a 200 MHz clock frequency. Our best latency is [Formula: see text] lower and our best throughput is [Formula: see text] higher compared to the best previous works. The code for our implementation is open-source and publicly available on GitHub at https://github.com/MFJI/NASBRESNET .
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
整齐半青完成签到 ,获得积分10
5秒前
fogsea完成签到,获得积分0
5秒前
机智笑南发布了新的文献求助10
5秒前
空白完成签到,获得积分10
5秒前
量子星尘发布了新的文献求助10
5秒前
科研小王完成签到,获得积分10
10秒前
帅气代云完成签到 ,获得积分10
11秒前
Samuel98完成签到 ,获得积分10
11秒前
qwe完成签到,获得积分10
12秒前
秦源完成签到,获得积分20
14秒前
lili完成签到 ,获得积分10
15秒前
郭星星完成签到,获得积分10
15秒前
柳觅夏完成签到,获得积分10
19秒前
xiaxia42完成签到 ,获得积分10
20秒前
科研通AI6.3应助球球子采纳,获得30
20秒前
如意雨雪完成签到 ,获得积分10
21秒前
浅忆晨曦完成签到 ,获得积分10
23秒前
小雨点Logan完成签到,获得积分10
26秒前
晴空万里完成签到 ,获得积分10
27秒前
Echoheart完成签到,获得积分10
27秒前
笨笨和串串完成签到 ,获得积分10
27秒前
帅气的祥完成签到,获得积分10
28秒前
闫晓美完成签到,获得积分10
28秒前
卿霜完成签到 ,获得积分10
30秒前
量子星尘发布了新的文献求助10
31秒前
热心市民完成签到 ,获得积分10
33秒前
Andyfragrance完成签到,获得积分10
34秒前
Cold-Drink-Shop完成签到,获得积分10
34秒前
林北bei完成签到,获得积分10
35秒前
zhaoyaoshi完成签到 ,获得积分10
38秒前
科研通AI2S应助科研通管家采纳,获得10
38秒前
顺心抽屉完成签到 ,获得积分10
39秒前
LBQ完成签到,获得积分10
42秒前
大饼完成签到 ,获得积分10
42秒前
loga80完成签到,获得积分0
44秒前
奋斗的妙海完成签到 ,获得积分0
47秒前
量子星尘发布了新的文献求助10
48秒前
mp5完成签到,获得积分10
48秒前
安尔完成签到 ,获得积分10
50秒前
鲁卓林完成签到,获得积分10
51秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Handbook of pharmaceutical excipients, Ninth edition 5000
Aerospace Standards Index - 2026 ASIN2026 3000
Relation between chemical structure and local anesthetic action: tertiary alkylamine derivatives of diphenylhydantoin 1000
Signals, Systems, and Signal Processing 610
Discrete-Time Signals and Systems 610
Principles of town planning : translating concepts to applications 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6066665
求助须知:如何正确求助?哪些是违规求助? 7898967
关于积分的说明 16322911
捐赠科研通 5208397
什么是DOI,文献DOI怎么找? 2786304
邀请新用户注册赠送积分活动 1769013
关于科研通互助平台的介绍 1647813