A 64-core mixed-signal in-memory compute chip based on phase-change memory for deep neural network inference

计算机科学 炸薯条 半导体存储器 卷积神经网络 人工神经网络 推论 CMOS芯片 吞吐量 嵌入式系统 计算机硬件 并行计算 人工智能 电子工程 工程类 电信 无线
作者
Manuel Le Gallo,Riduan Khaddam-Aljameh,Miloš Stanisavljević,Athanasios Vasilopoulos,Benedikt Kersting,Martino Dazzi,Geethan Karunaratne,Matthias Bräendli,Abhairaj Singh,Silvia Melitta Mueller,Julian Buechel,Xavier Timoneda,Vinay Joshi,Urs Egger,Angelo Garofalo,Αναστάσιος Πετρόπουλος,Theodore Antonakopoulos,Kevin Brew,Choi, Samuel,Injo Ok
出处
期刊:Cornell University - arXiv 被引量:18
标识
DOI:10.48550/arxiv.2212.02872
摘要

The need to repeatedly shuttle around synaptic weight values from memory to processing units has been a key source of energy inefficiency associated with hardware implementation of artificial neural networks. Analog in-memory computing (AIMC) with spatially instantiated synaptic weights holds high promise to overcome this challenge, by performing matrix-vector multiplications (MVMs) directly within the network weights stored on a chip to execute an inference workload. However, to achieve end-to-end improvements in latency and energy consumption, AIMC must be combined with on-chip digital operations and communication to move towards configurations in which a full inference workload is realized entirely on-chip. Moreover, it is highly desirable to achieve high MVM and inference accuracy without application-wise re-tuning of the chip. Here, we present a multi-core AIMC chip designed and fabricated in 14-nm complementary metal-oxide-semiconductor (CMOS) technology with backend-integrated phase-change memory (PCM). The fully-integrated chip features 64 256x256 AIMC cores interconnected via an on-chip communication network. It also implements the digital activation functions and processing involved in ResNet convolutional neural networks and long short-term memory (LSTM) networks. We demonstrate near software-equivalent inference accuracy with ResNet and LSTM networks while implementing all the computations associated with the weight layers and the activation functions on-chip. The chip can achieve a maximal throughput of 63.1 TOPS at an energy efficiency of 9.76 TOPS/W for 8-bit input/output matrix-vector multiplications.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
怕黑凡之发布了新的文献求助30
1秒前
Ricky发布了新的文献求助10
1秒前
小刘小刘完成签到,获得积分10
1秒前
2秒前
2秒前
winter完成签到,获得积分10
2秒前
xiaxia发布了新的文献求助10
3秒前
科研小白发布了新的文献求助10
3秒前
天天快乐应助太叔开山采纳,获得10
3秒前
缥缈纲完成签到,获得积分10
4秒前
甜蜜的芾完成签到,获得积分10
4秒前
小邓完成签到 ,获得积分10
5秒前
5秒前
lxl完成签到,获得积分10
7秒前
7秒前
顺利紫山完成签到,获得积分10
8秒前
惜海完成签到,获得积分10
9秒前
jlk完成签到,获得积分10
10秒前
森陌完成签到,获得积分10
10秒前
Xylo完成签到,获得积分10
10秒前
丘比特应助xiaxia采纳,获得10
12秒前
王小西完成签到,获得积分10
12秒前
西瓜完成签到,获得积分10
12秒前
Mireia完成签到,获得积分10
13秒前
可爱的函函应助惜海采纳,获得10
14秒前
BU完成签到 ,获得积分20
14秒前
小羊完成签到 ,获得积分10
15秒前
16秒前
16秒前
小灰完成签到,获得积分10
17秒前
Owen应助内蒙古大学采纳,获得10
19秒前
肉肉完成签到 ,获得积分10
19秒前
欢城完成签到,获得积分10
20秒前
20秒前
阿银发布了新的文献求助10
22秒前
mouse完成签到,获得积分10
22秒前
12驳回了小蘑菇应助
23秒前
23秒前
24秒前
25秒前
高分求助中
Psychopathic Traits and Quality of Prison Life 1000
Chemistry and Physics of Carbon Volume 18 800
The formation of Australian attitudes towards China, 1918-1941 660
Signals, Systems, and Signal Processing 610
天津市智库成果选编 600
Forced degradation and stability indicating LC method for Letrozole: A stress testing guide 500
全相对论原子结构与含时波包动力学的理论研究--清华大学 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6451729
求助须知:如何正确求助?哪些是违规求助? 8263452
关于积分的说明 17608388
捐赠科研通 5516377
什么是DOI,文献DOI怎么找? 2903719
邀请新用户注册赠送积分活动 1880647
关于科研通互助平台的介绍 1722664