清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Transformer Acceleration with Dynamic Sparse Attention

加速 利用 计算机科学 瓶颈 计算 变压器 软件部署 计算机工程 二次方程 一套 并行计算 算法 嵌入式系统 软件工程 电压 工程类 计算机安全 历史 几何学 电气工程 数学 考古
作者
Liu Liu,Zheng Qu,Zhaodong Chen,Yufei Ding,Yuan Xie
出处
期刊:Cornell University - arXiv 被引量:10
标识
DOI:10.48550/arxiv.2110.11299
摘要

Transformers are the mainstream of NLP applications and are becoming increasingly popular in other domains such as Computer Vision. Despite the improvements in model quality, the enormous computation costs make Transformers difficult at deployment, especially when the sequence length is large in emerging applications. Processing attention mechanism as the essential component of Transformer is the bottleneck of execution due to the quadratic complexity. Prior art explores sparse patterns in attention to support long sequence modeling, but those pieces of work are on static or fixed patterns. We demonstrate that the sparse patterns are dynamic, depending on input sequences. Thus, we propose the Dynamic Sparse Attention (DSA) that can efficiently exploit the dynamic sparsity in the attention of Transformers. Compared with other methods, our approach can achieve better trade-offs between accuracy and model complexity. Moving forward, we identify challenges and provide solutions to implement DSA on existing hardware (GPUs) and specialized hardware in order to achieve practical speedup and efficiency improvements for Transformer execution.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
asdwind完成签到,获得积分10
31秒前
乐乐应助科研通管家采纳,获得10
1分钟前
woxinyouyou完成签到,获得积分0
1分钟前
pjxxx完成签到 ,获得积分10
1分钟前
胖小羊完成签到 ,获得积分10
2分钟前
酷波er应助科研通管家采纳,获得10
3分钟前
xwx完成签到,获得积分10
3分钟前
xwx发布了新的文献求助30
3分钟前
朴素的山蝶完成签到 ,获得积分10
3分钟前
GankhuyagJavzan完成签到,获得积分10
4分钟前
4分钟前
gyx完成签到 ,获得积分10
4分钟前
冷静的棒棒糖完成签到 ,获得积分10
5分钟前
小文子完成签到 ,获得积分10
6分钟前
Jasper应助Zxxxx采纳,获得20
6分钟前
dream完成签到 ,获得积分10
6分钟前
6分钟前
Zxxxx发布了新的文献求助20
6分钟前
小强完成签到 ,获得积分10
6分钟前
土拨鼠完成签到 ,获得积分10
7分钟前
大个应助科研通管家采纳,获得10
7分钟前
孙皓然完成签到 ,获得积分10
7分钟前
Camila完成签到,获得积分10
7分钟前
爱吃鱼的猫完成签到,获得积分10
7分钟前
小么完成签到 ,获得积分10
7分钟前
TOUHOUU完成签到 ,获得积分10
7分钟前
搞怪白秋完成签到 ,获得积分10
8分钟前
coolru完成签到 ,获得积分20
8分钟前
夏夜完成签到 ,获得积分10
8分钟前
现实的俊驰完成签到 ,获得积分10
8分钟前
田様应助Epiphany采纳,获得10
8分钟前
8分钟前
Epiphany发布了新的文献求助10
8分钟前
研友_nxw2xL完成签到,获得积分10
9分钟前
Epiphany完成签到,获得积分10
9分钟前
muriel完成签到,获得积分10
9分钟前
香蕉觅云应助科研通管家采纳,获得10
9分钟前
10分钟前
10分钟前
NexusExplorer应助qixinyi采纳,获得10
10分钟前
高分求助中
Mass producing individuality 600
Algorithmic Mathematics in Machine Learning 500
Разработка метода ускоренного контроля качества электрохромных устройств 500
A Combined Chronic Toxicity and Carcinogenicity Study of ε-Polylysine in the Rat 400
Advances in Underwater Acoustics, Structural Acoustics, and Computational Methodologies 300
NK Cell Receptors: Advances in Cell Biology and Immunology by Colton Williams (Editor) 200
Effect of clapping movement with groove rhythm on executive function: focusing on audiomotor entrainment 200
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3827326
求助须知:如何正确求助?哪些是违规求助? 3369656
关于积分的说明 10456620
捐赠科研通 3089290
什么是DOI,文献DOI怎么找? 1699830
邀请新用户注册赠送积分活动 817520
科研通“疑难数据库(出版商)”最低求助积分说明 770251