亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

FinePack: Transparently Improving the Efficiency of Fine-Grained Transfers in Multi-GPU Systems

计算机科学 可扩展性 并行计算 PCI Express 库达 程序设计范式 架空(工程) 嵌入式系统 操作系统 现场可编程门阵列 程序设计语言
作者
Harini Muthukrishnan,Daniel C. Lustig,Oreste Villa,Thomas F. Wenisch,David Nellans
标识
DOI:10.1109/hpca56546.2023.10070949
摘要

Recent studies have shown that using fine-grained peer-to-peer (P2P) stores to communicate among devices in multi-GPU systems is a promising path to achieve strong performance scaling. In many irregular applications, such as graph algorithms and sparse linear algebra, small sub-cache line (4-32B) stores arise naturally when using the P2P paradigm. This is particularly problematic in multi-GPU systems because inter-GPU interconnects are optimized for bulk transfers rather than small operations. As a consequence, application developers either resort to complex programming techniques to work around this small transfer inefficiency or fall back to bulk inter-GPU DMA transfers that have limited performance scalability. We propose FinePack, a set of limited I/O interconnect and GPU hardware enhancements that enable small peer-to-peer stores to achieve interconnect efficiency that rivals bulk transfers while maintaining the simplicity of a peer-to-peer memory access programming model. Exploiting the GPU’s weak memory model, FinePack dynamically coalesces and compresses small writes into a larger I/O message that reduces link-level protocol overhead. FinePack is fully transparent to software and requires no changes to the GPU’s virtual memory system. We evaluate FinePack on a system comprising 4 Volta GPUs on a PCIe 4.0 interconnect to show FinePack improves interconnect efficiency for small peer-to-peer stores by 3×. This results in 4-GPU strong scaling performance 1.4× better than traditional DMA based multi-GPU programming and comes within 71% of the maximum achievable strong scaling performance.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
6秒前
heisa完成签到,获得积分10
13秒前
连玉完成签到,获得积分10
17秒前
李爱国应助隐形丹珍采纳,获得10
24秒前
29秒前
29秒前
29秒前
29秒前
29秒前
29秒前
科研通AI2S应助靤君采纳,获得10
37秒前
细心白竹完成签到 ,获得积分10
54秒前
57秒前
林间发布了新的文献求助10
1分钟前
ding应助林间采纳,获得10
1分钟前
1分钟前
隐形丹珍发布了新的文献求助10
1分钟前
zzzrrr完成签到 ,获得积分10
1分钟前
泊岸发布了新的文献求助10
1分钟前
1分钟前
1分钟前
天天快乐应助科研通管家采纳,获得10
1分钟前
2分钟前
2分钟前
2分钟前
2分钟前
2分钟前
2分钟前
2分钟前
2分钟前
2分钟前
2分钟前
2分钟前
2分钟前
2分钟前
2分钟前
2分钟前
2分钟前
2分钟前
乐乐应助自然如冰采纳,获得10
2分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
The formation of Australian attitudes towards China, 1918-1941 640
Signals, Systems, and Signal Processing 610
天津市智库成果选编 600
全相对论原子结构与含时波包动力学的理论研究--清华大学 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6444432
求助须知:如何正确求助?哪些是违规求助? 8258350
关于积分的说明 17591072
捐赠科研通 5503640
什么是DOI,文献DOI怎么找? 2901372
邀请新用户注册赠送积分活动 1878421
关于科研通互助平台的介绍 1717736