Memory-centric accelerator design for Convolutional Neural Networks

计算机科学 现场可编程门阵列 瓶颈 嵌入式系统 卷积神经网络 内存层次结构 高效能源利用 Virtex公司 设计流量 硬件加速 统一内存访问 内存带宽 计算机体系结构 带宽(计算) 计算机硬件 内存管理 并行计算 半导体存储器 人工智能 计算机网络 隐藏物 工程类 电气工程
作者
Maurice Peemen,Arnaud Arindra Adiyoso Setio,Bart Mesman,Henk Corporaal
标识
DOI:10.1109/iccd.2013.6657019
摘要

In the near future, cameras will be used everywhere as flexible sensors for numerous applications.For mobility and privacy reasons, the required image processing should be local on embedded computer platforms with performance requirements and energy constraints.Dedicated acceleration of Convolutional Neural Networks (CNN) can achieve these targets with enough flexibility to perform multiple vision tasks.A challenging problem for the design of efficient accelerators is the limited amount of external memory bandwidth.We show that the effects of the memory bottleneck can be reduced by a flexible memory hierarchy that supports the complex data access patterns in CNN workload.The efficiency of the on-chip memories is maximized by our scheduler that uses tiling to optimize for data locality.Our design flow ensures that on-chip memory size is minimized, which reduces area and energy usage.The design flow is evaluated by a High Level Synthesis implementation on a Virtex 6 FPGA board.Compared to accelerators with standard scratchpad memories the FPGA resources can be reduced up to 13x while maintaining the same performance.Alternatively, when the same amount of FPGA resources is used our accelerators are up to 11x faster.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
seven_yao完成签到,获得积分10
刚刚
小平发布了新的文献求助10
刚刚
枍枫完成签到,获得积分10
刚刚
彭于晏应助哈哈哈采纳,获得10
1秒前
健壮惋清完成签到 ,获得积分10
1秒前
妙奇完成签到,获得积分10
2秒前
可爱的函函应助溜了溜了采纳,获得10
3秒前
第五明月完成签到,获得积分10
4秒前
似风完成签到,获得积分10
4秒前
梅西完成签到 ,获得积分10
4秒前
蒋若风完成签到,获得积分10
5秒前
ZoeyD完成签到 ,获得积分10
6秒前
小马甲应助wandaiji采纳,获得10
6秒前
YY-Bubble完成签到,获得积分10
6秒前
追寻紫安完成签到,获得积分10
6秒前
medzhou完成签到,获得积分10
6秒前
共享精神应助科研通管家采纳,获得10
7秒前
小玉应助Han采纳,获得10
7秒前
8秒前
在逃蛋挞完成签到 ,获得积分10
9秒前
脑洞疼应助可靠小蚂蚁采纳,获得10
9秒前
乐正熠彤完成签到,获得积分10
11秒前
Hsijing完成签到,获得积分10
11秒前
格物致知完成签到,获得积分10
11秒前
圆圆完成签到,获得积分10
12秒前
13秒前
烂漫的蜡烛完成签到 ,获得积分10
13秒前
coolkid发布了新的文献求助10
13秒前
yy完成签到 ,获得积分10
13秒前
天真依玉完成签到,获得积分10
14秒前
vv123456ha完成签到,获得积分10
14秒前
OAHCIL完成签到 ,获得积分10
16秒前
清风完成签到 ,获得积分10
17秒前
小潘完成签到,获得积分10
17秒前
17秒前
18秒前
Getlogger发布了新的文献求助10
18秒前
居然是我完成签到,获得积分10
18秒前
英俊芷完成签到,获得积分10
18秒前
勤劳的寄灵完成签到,获得积分10
19秒前
高分求助中
Java: A Beginner's Guide, 10th Edition 5000
Applied Survey Data Analysis (第三版, 2025) 800
Narcissistic Personality Disorder 700
Research Handbook on Multiculturalism 500
The Martian climate revisited: atmosphere and environment of a desert planet 500
Plasmonics 400
建国初期十七年翻译活动的实证研究. 建国初期十七年翻译活动的实证研究 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3847965
求助须知:如何正确求助?哪些是违规求助? 3390639
关于积分的说明 10562321
捐赠科研通 3111053
什么是DOI,文献DOI怎么找? 1714640
邀请新用户注册赠送积分活动 825337
科研通“疑难数据库(出版商)”最低求助积分说明 775498