亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Ascend: a Scalable and Unified Architecture for Ubiquitous Deep Neural Network Computing : Industry Track Paper

计算机科学 可扩展性 测距 嵌入式系统 以数据库为中心的体系结构 建筑 编译程序 概括性 内存层次结构 分布式计算 参考体系结构 计算机体系结构 软件体系结构 操作系统 软件 隐藏物 心理学 艺术 视觉艺术 电信 心理治疗师
作者
Heng Liao,Jiajin Tu,Jing Xia,Liu Hu,Zhou Xi-ping,Hao Yuan,Yuxing Hu
出处
期刊:High-Performance Computer Architecture 被引量:28
标识
DOI:10.1109/hpca51647.2021.00071
摘要

Deep neural networks (DNNs) have been successfully applied to a great variety of applications, ranging from small IoT devices to large scale services in a data center. In order to improve the efficiency of processing these DNN models, dedicated hardware accelerators are required for all these scenarios. Theoretically, there exists an optimized acceleration architecture for each application. However, considering the cost of chip design and corresponding tool-chain development, researchers need to trade off between efficiency and generality. In this work, we demonstrate that it is practical to use a unified architecture, called Ascend, to support those applications, ranging from IoT devices to data-center services. We provide a lot of design details to explain that the success of Ascend relies on contributions from different levels. First, heterogeneous computing units are employed to support various DNN models. And the datapath is adapted according to the requirement of computing and data access. Second, when scaling the Ascend architecture from a single core to a cluster containing thousands of cores, it involves design efforts, such as memory hierarchy and system level integration. Third, a multi-tier compiler, which provides flexible choices for developers, is the last critical piece. Experimental results show that using accelerators based on the Ascend architecture can achieve comparable or even better performance in different applications. In addition, various chips based on the Ascend architecture have been successfully commercialized. More than 100 million chips have been used in real products.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
4秒前
Nancy发布了新的文献求助10
8秒前
直率芮完成签到 ,获得积分10
8秒前
科研小驴完成签到,获得积分10
8秒前
尘尘完成签到,获得积分10
9秒前
12秒前
科研小驴发布了新的文献求助30
16秒前
zz完成签到 ,获得积分10
30秒前
pink发布了新的文献求助10
30秒前
李小强完成签到,获得积分10
37秒前
光亮静槐完成签到 ,获得积分10
38秒前
39秒前
Jasper应助coco采纳,获得30
39秒前
BAEK完成签到 ,获得积分10
39秒前
葛怀锐完成签到 ,获得积分10
41秒前
999完成签到,获得积分10
47秒前
JamesPei应助123采纳,获得10
50秒前
CipherSage应助姜宇航采纳,获得10
56秒前
59秒前
从容芮应助OCDer采纳,获得150
1分钟前
123发布了新的文献求助10
1分钟前
1分钟前
完美世界应助科研通管家采纳,获得10
1分钟前
思源应助科研通管家采纳,获得10
1分钟前
1分钟前
1分钟前
解丁发布了新的文献求助10
1分钟前
喜悦的小土豆完成签到 ,获得积分10
1分钟前
一叶扁舟发布了新的文献求助10
1分钟前
BetterH完成签到 ,获得积分10
1分钟前
随波逐流完成签到,获得积分10
1分钟前
CipherSage应助解丁采纳,获得10
1分钟前
1分钟前
coco发布了新的文献求助30
1分钟前
coco完成签到,获得积分10
1分钟前
1分钟前
2分钟前
姜宇航发布了新的文献求助10
2分钟前
竹叶青发布了新的文献求助80
2分钟前
27小天使应助姜宇航采纳,获得20
2分钟前
高分求助中
ФОРМИРОВАНИЕ АО "МЕЖДУНАРОДНАЯ КНИГА" КАК ВАЖНЕЙШЕЙ СИСТЕМЫ ОТЕЧЕСТВЕННОГО КНИГОРАСПРОСТРАНЕНИЯ 3000
Electron microscopy study of magnesium hydride (MgH2) for Hydrogen Storage 1000
生物降解型栓塞微球市场(按产品类型、应用和最终用户)- 2030 年全球预测 500
Quantum Computing for Quantum Chemistry 500
Thermal Expansion of Solids (CINDAS Data Series on Material Properties, v. I-4) 470
Fire Protection Handbook, 21st Edition volume1和volume2 360
Phylogenetic study of the order Polydesmida (Myriapoda: Diplopoda) 360
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3901792
求助须知:如何正确求助?哪些是违规求助? 3446507
关于积分的说明 10844894
捐赠科研通 3171617
什么是DOI,文献DOI怎么找? 1752407
邀请新用户注册赠送积分活动 847230
科研通“疑难数据库(出版商)”最低求助积分说明 789757