清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

A Survey on Auto-Parallelism of Large-Scale Deep Learning Training

计算机科学 平行性(语法) 数据并行性 任务并行性 比例(比率) 深度学习 人工智能 培训(气象学) 并行处理 并行计算 机器学习 量子力学 物理 气象学
作者
Peng Liang,Yu Tang,Xiaoda Zhang,Youhui Bai,Teng Su,Zhiquan Lai,Linbo Qiao,Dongsheng Li
出处
期刊:IEEE Transactions on Parallel and Distributed Systems [Institute of Electrical and Electronics Engineers]
卷期号:34 (8): 2377-2390 被引量:5
标识
DOI:10.1109/tpds.2023.3281931
摘要

Deep learning (DL) has gained great success in recent years, leading to state-of-the-art performance in research community and industrial fields like computer vision and natural language processing. One of the reasons for this success is the huge amount parameters adopted in DL models. However, it is impractical to train a moderately large model with a large number of parameters on a typical single device. Thus, It is necessary to train DL models in clusters with distributed training algorithms. However, traditional distributed training algorithms are usually sub-optimal and highly customized, which owns the drawbacks to train large-scale DL models in varying computing clusters. To handle the above problem, researchers propose auto-parallelism, which is promising to train large-scale DL models efficiently and practically in various computing clusters. In this survey, we perform a broad and thorough investigation on challenges, basis, and strategy searching methods of auto-parallelism in DL training. First, we abstract basic parallelism schemes with their communication cost and memory consumption in DL training. Further, we analyze and compare a series of current auto-parallelism works and investigate strategies and searching methods which are commonly used in practice. At last, we discuss several trends in auto-parallelism which are promising in further research.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
xiaowangwang完成签到 ,获得积分10
1秒前
忧郁的涵雁完成签到 ,获得积分10
8秒前
zuhangzhao完成签到 ,获得积分10
16秒前
安然完成签到 ,获得积分10
18秒前
那咋办嘛完成签到 ,获得积分10
20秒前
可爱的函函应助infognet采纳,获得10
20秒前
Kashing完成签到,获得积分10
21秒前
虚心雨竹完成签到 ,获得积分10
31秒前
Orange应助甜美修洁采纳,获得10
34秒前
feiyang完成签到 ,获得积分10
45秒前
cocolinfly完成签到 ,获得积分10
47秒前
molihuakai应助沫沫采纳,获得30
49秒前
闪闪的代秋完成签到 ,获得积分10
49秒前
没事搞点学术完成签到,获得积分10
49秒前
spinon完成签到,获得积分10
55秒前
56秒前
圆圆完成签到 ,获得积分10
56秒前
研友_西门孤晴完成签到,获得积分10
57秒前
58秒前
张智慧完成签到 ,获得积分10
59秒前
1分钟前
infognet发布了新的文献求助10
1分钟前
1分钟前
沫沫发布了新的文献求助30
1分钟前
1分钟前
阿里发布了新的文献求助10
1分钟前
1分钟前
1分钟前
Ray完成签到 ,获得积分10
1分钟前
简爱完成签到 ,获得积分10
1分钟前
正常糖完成签到 ,获得积分10
1分钟前
Silence完成签到 ,获得积分10
1分钟前
我谈完成签到,获得积分10
1分钟前
1分钟前
1分钟前
apt完成签到 ,获得积分10
1分钟前
高海龙完成签到 ,获得积分10
1分钟前
1分钟前
清淮完成签到 ,获得积分10
1分钟前
JJZ完成签到,获得积分10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Introduction to Helicopter and Tiltrotor Flight Simulation, Second Edition 2500
Developing Genetic Editing Tools for Lysobacter 2000
卤化钙钛矿人工突触的研究 2000
Моделирование процессов самоорганизации в кристаллообразующих системах 1000
History of U.S. Space Surveillance and Satellite Cataloging 1000
Malcolm Fraser : a biography 700
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6512326
求助须知:如何正确求助?哪些是违规求助? 8305779
关于积分的说明 17741951
捐赠科研通 5613891
什么是DOI,文献DOI怎么找? 2923751
邀请新用户注册赠送积分活动 1901004
关于科研通互助平台的介绍 1762720