Automatic Pipeline Parallelism: A Parallel Inference Framework for Deep Learning Applications in 6G Mobile Communication Systems

计算机科学 推论 管道(软件) 延迟(音频) 人工智能 深度学习 机器学习 并行计算 程序设计语言 电信
作者
Hongjian Shi,Weichu Zheng,Zifei Liu,Ruhui Ma,Haibing Guan
出处
期刊:IEEE Journal on Selected Areas in Communications [Institute of Electrical and Electronics Engineers]
卷期号:: 1-1
标识
DOI:10.1109/jsac.2023.3280970
摘要

With the rapid development of wireless communication, achieving the neXt generation Ultra-Reliable and Low-Latency Communications (xURLLC) in 6G mobile communication systems has become a critical problem. Among many applications in xURLLC, deep learning model inference requires improvement over its efficiency. Due to the heterogeneous hardware environment in 6G, parallel schedules from distributed machine learning and edge computing has been borrowed to tackle the efficiency problem. However, traditional parallel schedules suffer from high latency, low throughput, and low device utility. In this paper, we propose Automatic Pipeline Parallelism ( AP 2 ), a parallel inference framework for deep learning applications in 6G mobile communication systems, to improve the model inference efficiency while maintaining reliability. AP 2 contains three sub-modules. A task-device affinity predictor predicts a task’s expected execution time on a given device. The parallel inference arrangement optimizer finds the most suitable device for each task. The parallel inference scheduler converts the arrangement to a schedule that can be directly executed in the system. The experimental results show that AP 2 can achieve better latency, throughput, reliability, and device utility than other parallel schedules. Also, the priority of the sub-module designs has been approved through the experiments.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
qiqi7788发布了新的文献求助10
1秒前
大力元霜完成签到,获得积分10
1秒前
张爱学发布了新的文献求助10
1秒前
zhongxia完成签到 ,获得积分10
1秒前
阔达的棒棒糖完成签到,获得积分10
2秒前
wuwuwuuu完成签到,获得积分10
2秒前
一路向阳完成签到,获得积分10
2秒前
2秒前
打打应助ttly采纳,获得10
3秒前
3秒前
Orange应助Tyler采纳,获得10
3秒前
研友_VZG7GZ应助勤奋向真采纳,获得10
3秒前
4秒前
pb完成签到,获得积分10
4秒前
苏大大完成签到 ,获得积分10
4秒前
兔BF完成签到,获得积分10
5秒前
Zoo应助guosheng采纳,获得20
5秒前
不想干活应助walu采纳,获得10
5秒前
woobinhua完成签到,获得积分10
5秒前
Bobo完成签到,获得积分10
7秒前
赏光发布了新的文献求助10
8秒前
8秒前
LXX完成签到,获得积分10
8秒前
yD发布了新的文献求助10
9秒前
9秒前
yao发布了新的文献求助10
9秒前
9秒前
吴海娇完成签到,获得积分10
10秒前
wang完成签到,获得积分20
10秒前
11秒前
doudou完成签到 ,获得积分10
11秒前
11秒前
勤劳冰烟完成签到,获得积分10
12秒前
12秒前
JasVe完成签到 ,获得积分10
12秒前
zdy完成签到 ,获得积分10
12秒前
坚强的如蓉完成签到,获得积分10
13秒前
13秒前
老迟到的凝冬完成签到,获得积分10
13秒前
wang发布了新的文献求助10
13秒前
高分求助中
(禁止应助)【重要!!请各位详细阅读】【科研通的精品贴汇总】 10000
International Code of Nomenclature for algae, fungi, and plants (Madrid Code) (Regnum Vegetabile) 1500
Robot-supported joining of reinforcement textiles with one-sided sewing heads 820
Византийско-аланские отно- шения (VI–XII вв.) 500
Improvement of Fingering-Induced Pattern Collapse by Adjusting Chemical Mixing Procedure 500
水稻光合CO2浓缩机制的创建及其作用研究 500
探索化学的奥秘:电子结构方法 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4179215
求助须知:如何正确求助?哪些是违规求助? 3714597
关于积分的说明 11710799
捐赠科研通 3395620
什么是DOI,文献DOI怎么找? 1862977
邀请新用户注册赠送积分活动 921504
科研通“疑难数据库(出版商)”最低求助积分说明 833299