Fully Pipelined FPGA Acceleration of Binary Convolutional Neural Networks with Neural Architecture Search

现场可编程门阵列 卷积神经网络 计算机科学 人工神经网络 建筑 二进制数 加速度 计算机体系结构 并行计算 硬件加速 嵌入式系统 计算机硬件 人工智能 算术 数学 艺术 物理 经典力学 视觉艺术
作者
Mengfei Ji,Zaid Al-Ars,Yu‐Chun Chang,Bao‐Lin Zhang
出处
期刊:Journal of Circuits, Systems, and Computers [World Scientific]
卷期号:33 (10)
标识
DOI:10.1142/s0218126624501706
摘要

In this paper, we present a fully pipelined and semi-parallel channel convolutional neural network hardware accelerator structure. This structure can trade off the compute time and the hardware utilization, allowing the accelerator to be layer pipelined without the need for fully parallelizing the input and output channels. A parallel strategy is applied to reduce the time gap in transferring the output results between different layers. The parallelism can be decided based on the hardware resources on the target FPGA. We use this structure to implement a binary ResNet18 based on the neural architecture search strategy, which can increase the accuracy of manually designed binary convolutional neural networks. Our optimized binary ResNet18 can achieve a Top-1 accuracy of 60.5% on the ImageNet dataset. We deploy this ResNet18 hardware implementation on an Alphadata 9H7 FPGA, connected with an OpenCAPI interface, to demonstrate the hardware capabilities. Depending on the amount of parallelism used, the latency can range from 1.12 to 6.33 ms, with a corresponding throughput of 4.56 to 0.71 TOPS for different hardware utilization, with a 200 MHz clock frequency. Our best latency is [Formula: see text] lower and our best throughput is [Formula: see text] higher compared to the best previous works. The code for our implementation is open-source and publicly available on GitHub at https://github.com/MFJI/NASBRESNET .
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
du完成签到 ,获得积分0
1秒前
han完成签到,获得积分10
1秒前
4秒前
量子星尘发布了新的文献求助10
5秒前
自然听兰发布了新的文献求助10
5秒前
Jemry发布了新的文献求助10
6秒前
6秒前
6秒前
7秒前
orixero应助cwwqt采纳,获得10
8秒前
奇大可完成签到 ,获得积分10
8秒前
科目三应助震动的戒指采纳,获得10
8秒前
廖小同完成签到,获得积分10
8秒前
9秒前
小二郎应助Jemry采纳,获得10
9秒前
10秒前
10秒前
10秒前
11秒前
科研通AI6应助结实的以莲采纳,获得10
11秒前
快乐非笑发布了新的文献求助10
12秒前
浮游应助刘茂帅采纳,获得10
12秒前
12秒前
12秒前
江边鸟发布了新的文献求助20
13秒前
jyy应助hzauhzau采纳,获得10
13秒前
qingmao完成签到,获得积分10
13秒前
独特乘云发布了新的文献求助10
14秒前
量子星尘发布了新的文献求助10
15秒前
zyq1996完成签到,获得积分10
15秒前
小米周发布了新的文献求助30
15秒前
亚尔发布了新的文献求助10
16秒前
炕上的西西弗应助baimo采纳,获得10
16秒前
GAGA完成签到,获得积分20
18秒前
18秒前
NexusExplorer应助Raymond采纳,获得10
20秒前
20秒前
xwq完成签到,获得积分10
21秒前
ylqqq发布了新的文献求助10
22秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Nuclear Fuel Behaviour under RIA Conditions 500
Sociologies et cosmopolitisme méthodologique 400
Why America Can't Retrench (And How it Might) 400
Another look at Archaeopteryx as the oldest bird 390
Optimization and Learning via Stochastic Gradient Search 300
Higher taxa of Basidiomycetes 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 催化作用 遗传学 冶金 电极 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 4673874
求助须知:如何正确求助?哪些是违规求助? 4052224
关于积分的说明 12531184
捐赠科研通 3745991
什么是DOI,文献DOI怎么找? 2068917
邀请新用户注册赠送积分活动 1098052
科研通“疑难数据库(出版商)”最低求助积分说明 978276