亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

LSDDL: Layer-Wise Sparsification for Distributed Deep Learning

计算机科学 可扩展性 人工智能 随机梯度下降算法 架空(工程) 瓶颈 人工神经网络 深度学习 机器学习 分布式计算 过程(计算) 利用 计算机工程 操作系统 嵌入式系统 数据库 计算机安全
作者
Yuxi Hong,Peng Han
出处
期刊:Big Data Research [Elsevier BV]
卷期号:26: 100272-100272 被引量:3
标识
DOI:10.1016/j.bdr.2021.100272
摘要

With an escalating arms race to adopt machine learning (ML) into diverse application domains, there is an urgent need to efficiently support distributed machine learning (ML) algorithms. As Stochastic Gradient Descent (SGD) is widely adopted in training ML models, the performance bottleneck of distributed ML would be the communication cost to transmit gradients through the network. While a lot of existing studies aim at compressing the gradient so as to reduce the overhead of network communication, they ignore the model structure in the process of compression. As a result, while they could reduce the communication time, they would result in serious computation discontinuity for deep neural networks, which will lower the prediction accuracy. In this paper, we propose LSDDL, a scalable and light-weighted method to boost the training process of deep learning models in shared-nothing environment. The cornerstone of LSDDL lies on the observation that different layers in a neural network have different importance in the process of decompression. To exploit this insight, we devise a sparsification strategy to compress the gradient of deep neural networks which can preserve the structural information of the model. In addition, we provide a series of compression techniques to further reduce the communication overhead and optimize the overall performance. We implement our LSDDL framework in the PyTorch system and encapsulate it as a user friendly API. We validate our proposed techniques by training several real models on a large cluster. Experimental results show that the communication time of LSDDL is up to 5.43 times less than the original SGD without losing much accuracy.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
去糖少冰完成签到,获得积分10
9秒前
若水完成签到,获得积分10
34秒前
40秒前
科研通AI5应助玛琳卡迪马采纳,获得10
54秒前
科研通AI5应助玛琳卡迪马采纳,获得10
54秒前
完美世界应助33采纳,获得10
54秒前
玛琳卡迪马完成签到,获得积分10
1分钟前
靓丽的熠彤完成签到,获得积分10
1分钟前
安渝完成签到 ,获得积分10
1分钟前
呼延乐枫完成签到,获得积分10
2分钟前
大模型应助科研通管家采纳,获得10
2分钟前
昭荃完成签到 ,获得积分0
2分钟前
mls完成签到,获得积分10
2分钟前
脱锦涛完成签到 ,获得积分10
2分钟前
3分钟前
我是老大应助33采纳,获得10
3分钟前
Yike发布了新的文献求助10
3分钟前
彩虹儿应助Yike采纳,获得10
3分钟前
4分钟前
4分钟前
空儒完成签到 ,获得积分10
4分钟前
hutu发布了新的文献求助10
4分钟前
思源应助hutu采纳,获得10
4分钟前
4分钟前
33发布了新的文献求助10
4分钟前
Sunziy完成签到,获得积分10
4分钟前
5分钟前
5分钟前
33发布了新的文献求助10
5分钟前
量子星尘发布了新的文献求助150
6分钟前
你好完成签到 ,获得积分0
7分钟前
7分钟前
7分钟前
hutu发布了新的文献求助10
7分钟前
酷酷问夏完成签到 ,获得积分10
7分钟前
情怀应助hutu采纳,获得10
7分钟前
彭于晏应助科研通管家采纳,获得10
8分钟前
8分钟前
as完成签到 ,获得积分10
8分钟前
空2完成签到 ,获得积分0
8分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
二维材料在应力作用下的力学行为和层间耦合特性研究 600
苯丙氨酸解氨酶的祖先序列重建及其催化性能 500
Schifanoia : notizie dell'istituto di studi rinascimentali di Ferrara : 66/67, 1/2, 2024 470
Effects of different anesthesia methods on bleeding and prognosis in endoscopic sinus surgery: a meta-analysis and systematic review of randomized controlled trials 400
Laboratory Animal Technician TRAINING MANUAL WORKBOOK 2012 edtion 400
Progress and Regression 400
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4844672
求助须知:如何正确求助?哪些是违规求助? 4144922
关于积分的说明 12833830
捐赠科研通 3891591
什么是DOI,文献DOI怎么找? 2139199
邀请新用户注册赠送积分活动 1159249
关于科研通互助平台的介绍 1059501