清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Optimizing CNN Computation Using RISC-V Custom Instruction Sets for Edge Platforms

计算机科学 精简计算指令集 计算 并行计算 指令集 GSM演进的增强数据速率 算法 人工智能
作者
Shihang Wang,Xingbo Wang,Zhiyuan Xu,Bingzhen Chen,Chenxi Feng,Qi Wang,Terry Tao Ye
出处
期刊:IEEE Transactions on Computers [Institute of Electrical and Electronics Engineers]
卷期号:73 (5): 1371-1384 被引量:2
标识
DOI:10.1109/tc.2024.3362060
摘要

Benefit from the custom instruction extension capabilities, RISC-V architecture can be optimized for many domain-specific applications. In this paper, we propose seven RISC-V SIMD (single instruction multiple data) custom instructions that can significantly optimize the convolution, activation and pool operations in CNN inference computation. More specifically, instruction CONV23 can greatly speed up the operation of F (2 × 2, 3 × 3). With the adoption of Winograd algorithm, the number of multiplications can be reduced from 36 to 16, and the execution time is also reduced from 140 to 21 clock cycles. These custom instructions can be executed in batch mode within the acceleration module where the immediate data can be reused, so the latency and energy overhead associated with excess memory accesses can be eliminated. Using inline assembler in C language, the custom instructions can be called and compiled together with C source code. A revised RISC-V processor, RI5CY-Accel is constructed on FPGA to accommodate these custom instructions. Revised LeNet-5, VGG16 and ResNet18 model; called LeNet-Accel, VGG16-Accel and ResNet18-Accel are also optimized based on RI5CY-Accel architecture. Benchmark experiments demonstrated that the inference of LeNet-Accel, VGG16-Accel and ResNet18-Accel based on RI5CY-Accel can greatly reduce the execution latency by over 76.6%, 88.8% and 87.1%, with the total energy consumption saving of 74.8%, 87.8% and 85.1% respectively.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
AmyHu完成签到,获得积分10
25秒前
qq完成签到 ,获得积分10
34秒前
42秒前
yanghuige发布了新的文献求助10
48秒前
zhangsan完成签到,获得积分10
1分钟前
梓树完成签到,获得积分20
1分钟前
1分钟前
通科研完成签到 ,获得积分10
1分钟前
卜十三发布了新的文献求助10
1分钟前
科研通AI5应助yanghuige采纳,获得10
1分钟前
科科通通完成签到,获得积分10
2分钟前
英喆完成签到 ,获得积分10
2分钟前
凤迎雪飘完成签到,获得积分10
2分钟前
2分钟前
2022H发布了新的文献求助20
2分钟前
whuhustwit完成签到,获得积分10
2分钟前
2分钟前
科研通AI5应助2022H采纳,获得10
2分钟前
3分钟前
fuyuhaoy完成签到,获得积分10
3分钟前
Sunny完成签到,获得积分10
3分钟前
自然的含蕾完成签到 ,获得积分10
4分钟前
共享精神应助俊逸吐司采纳,获得10
4分钟前
SCI的芷蝶完成签到 ,获得积分10
4分钟前
4分钟前
钉钉完成签到 ,获得积分10
5分钟前
3211应助科研通管家采纳,获得10
6分钟前
金钰贝儿完成签到,获得积分10
6分钟前
meijuan1210完成签到 ,获得积分10
7分钟前
vbnn完成签到 ,获得积分10
7分钟前
顾矜应助大雄先生采纳,获得10
7分钟前
Adam完成签到 ,获得积分10
7分钟前
7分钟前
大雄先生发布了新的文献求助10
8分钟前
大雄先生完成签到,获得积分20
8分钟前
星辰大海应助lulululululu采纳,获得30
8分钟前
刘刘完成签到 ,获得积分10
8分钟前
今后应助Tia采纳,获得10
8分钟前
深林盛世完成签到,获得积分10
9分钟前
xiaoyi完成签到 ,获得积分10
9分钟前
高分求助中
The world according to Garb 600
Разработка метода ускоренного контроля качества электрохромных устройств 500
Mass producing individuality 500
Chinesen in Europa – Europäer in China: Journalisten, Spione, Studenten 500
Arthur Ewert: A Life for the Comintern 500
China's Relations With Japan 1945-83: The Role of Liao Chengzhi // Kurt Werner Radtke 500
Two Years in Peking 1965-1966: Book 1: Living and Teaching in Mao's China // Reginald Hunt 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3819963
求助须知:如何正确求助?哪些是违规求助? 3362858
关于积分的说明 10418873
捐赠科研通 3081189
什么是DOI,文献DOI怎么找? 1695009
邀请新用户注册赠送积分活动 814799
科研通“疑难数据库(出版商)”最低求助积分说明 768522