Parallelizing DNN Training on GPUs: Challenges and Opportunities

数据并行性 计算机科学 平行性(语法) 并行计算 过程(计算) 任务并行性 工作量 极限(数学) 人工神经网络 指令级并行 人工智能 程序设计语言 数学分析 数学 操作系统
作者
Weizheng Xu,Youtao Zhang,Xulong Tang
出处
期刊:Companion Proceedings of the The Web Conference 2018 卷期号:: 174-178 被引量:13
标识
DOI:10.1145/3442442.3452055
摘要

In recent years, Deep Neural Networks (DNNs) have emerged as a widely adopted approach in many application domains. Training DNN models is also becoming a significant fraction of the datacenter workload. Recent evidence has demonstrated that modern DNNs are becoming more complex and the size of DNN parameters (i.e., weights) is also increasing. In addition, a large amount of input data is required to train the DNN models to reach target accuracy. As a result, the training performance becomes one of the major challenges that limit DNN adoption in real-world applications. Recent works have explored different parallelism strategies (i.e., data parallelism and model parallelism) and used multi-GPUs in datacenters to accelerate the training process. However, naively adopting data parallelism and model parallelism across multiple GPUs can lead to sub-optimal executions. The major reasons are i) the large amount of data movement that prevents the system from feeding the GPUs with the required data in a timely manner (for data parallelism); and ii) low GPU utilization caused by data dependency between layers that placed on different devices (for model parallelism).

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
威武安雁发布了新的文献求助50
1秒前
1秒前
口水斤完成签到,获得积分10
2秒前
毛爱民发布了新的文献求助10
4秒前
4秒前
我是老大应助反复发作采纳,获得10
5秒前
5秒前
Criminology34发布了新的文献求助300
5秒前
6秒前
纪云海完成签到,获得积分10
7秒前
8秒前
哈哈发布了新的文献求助10
9秒前
科研通AI2S应助悦耳煜祺采纳,获得10
9秒前
10秒前
一剑白完成签到 ,获得积分10
10秒前
10秒前
可爱的函函应助carnivore采纳,获得10
10秒前
Lucas发布了新的文献求助10
11秒前
12秒前
科目三应助炙热含之采纳,获得30
13秒前
科研通AI6.4应助胡子采纳,获得10
13秒前
13秒前
13秒前
14秒前
abjz发布了新的文献求助10
14秒前
xuheng81916完成签到,获得积分10
15秒前
sci完成签到,获得积分10
16秒前
echos完成签到,获得积分10
18秒前
Ning发布了新的文献求助10
19秒前
大马哈鱼发布了新的文献求助10
20秒前
葱花鱼发布了新的文献求助10
20秒前
科研通AI2S应助MrL采纳,获得10
20秒前
20秒前
小马甲应助Lucas采纳,获得10
21秒前
nyy完成签到,获得积分20
22秒前
薄荷发布了新的文献求助10
22秒前
24秒前
24秒前
曾曾完成签到,获得积分10
24秒前
归来也还可爱完成签到,获得积分10
25秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Development Across Adulthood 1000
Chemistry and Physics of Carbon Volume 18 800
The formation of Australian attitudes towards China, 1918-1941 660
Signals, Systems, and Signal Processing 610
天津市智库成果选编 600
全相对论原子结构与含时波包动力学的理论研究--清华大学 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6450241
求助须知:如何正确求助?哪些是违规求助? 8262622
关于积分的说明 17603684
捐赠科研通 5514189
什么是DOI,文献DOI怎么找? 2903236
邀请新用户注册赠送积分活动 1880311
关于科研通互助平台的介绍 1721919