已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Buffer Sizes Reduction for Memory-efficient CNN Inference on Mobile and Embedded Devices

计算机科学 内存占用 卷积神经网络 量化(信号处理) 修剪 还原(数学) 足迹 高内存 移动设备 推论 人工智能 并行计算 算法 生物 数学 操作系统 农学 古生物学 几何学
作者
Svetlana Minakova,Todor Stefanov
标识
DOI:10.1109/dsd51259.2020.00031
摘要

Nowadays, convolutional neural networks (CNNs) are the core of many intelligent systems, including those that run on mobile and embedded devices. However, the execution of computationally demanding and memory-hungry CNNs on resource-limited mobile and embedded devices is quite challenging. One of the main problems, when running CNNs on such devices, is the limited amount of memory available. Thus, reduction of the CNN memory footprint is crucial for the CNN inference on mobile and embedded devices. The CNN memory footprint is determined by the amount of memory required to store CNN parameters (weights and biases) and intermediate data, exchanged between CNN operators. The most common approaches, utilized to reduce the CNN memory footprint, such as pruning and quantization, reduce the memory required to store the CNN parameters. However, these approaches decrease the CNN accuracy. Moreover, with the increasing depth of the state-of-the-art CNNs, the intermediate data exchanged between CNN operators takes even more space than the CNN parameters. Therefore, in this paper, we propose a novel approach, which allows to reduce the memory, required to store intermediate data, exchanged between CNN operators. Unlike pruning and quantization approaches, our proposed approach preserves the CNN accuracy and reduces the CNN memory footprint at the cost of decreasing the CNN throughput. Rus, our approach is orthogonal to the pruning and quantization approaches, and can be combined with these approaches for further CNN memory footprint reduction.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
时笙发布了新的文献求助10
3秒前
动人的书雪完成签到,获得积分10
4秒前
乐观小之完成签到,获得积分0
9秒前
Hello应助wualexandra采纳,获得10
10秒前
胖k发布了新的文献求助10
11秒前
Meng发布了新的文献求助10
11秒前
明白放弃完成签到,获得积分10
12秒前
乐观小之发布了新的文献求助10
12秒前
18秒前
23秒前
啊离完成签到 ,获得积分10
23秒前
崔洪瑞完成签到,获得积分10
29秒前
飘逸皮卡丘完成签到,获得积分10
30秒前
二三完成签到 ,获得积分10
30秒前
心随以动完成签到 ,获得积分10
31秒前
32秒前
汉堡包应助专注的铃兰采纳,获得10
32秒前
愤怒的乐松完成签到,获得积分10
32秒前
大大怪完成签到,获得积分10
34秒前
36秒前
38秒前
泥花发布了新的文献求助10
39秒前
修辛完成签到 ,获得积分10
39秒前
41秒前
42秒前
悲凉的以寒完成签到 ,获得积分10
43秒前
43秒前
46秒前
飘逸飞绿完成签到 ,获得积分10
46秒前
英俊的铭应助科研通管家采纳,获得10
46秒前
小蘑菇应助科研通管家采纳,获得10
46秒前
SciGPT应助科研通管家采纳,获得10
46秒前
科研通AI2S应助科研通管家采纳,获得10
46秒前
GrindSeason应助科研通管家采纳,获得30
46秒前
甜蜜的小小完成签到,获得积分20
47秒前
子车茗应助22222采纳,获得30
47秒前
量子星尘发布了新的文献求助10
48秒前
胖k发布了新的文献求助10
48秒前
时笙完成签到,获得积分10
49秒前
50秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Aerospace Standards Index - 2026 ASIN2026 3000
Polymorphism and polytypism in crystals 1000
Signals, Systems, and Signal Processing 610
Discrete-Time Signals and Systems 610
Research Methods for Business: A Skill Building Approach, 9th Edition 500
Social Work and Social Welfare: An Invitation(7th Edition) 410
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6050467
求助须知:如何正确求助?哪些是违规求助? 7844370
关于积分的说明 16266188
捐赠科研通 5195698
什么是DOI,文献DOI怎么找? 2780145
邀请新用户注册赠送积分活动 1763140
关于科研通互助平台的介绍 1645089