| 标题 |
MagicDec: Breaking the Latency-Throughput Tradeoff for Long Context Generation with Speculative Decoding MagicDec:通过推测解码打破长上下文生成的延迟-吞吐量权衡
相关领域
延迟(音频)
解码方法
吞吐量
计算机科学
背景(考古学)
计算机网络
算法
电信
历史
无线
考古
|
| 网址 | |
| DOI | |
| 其它 |
期刊:arXiv (Cornell University) 作者:Jian Chen; V. Tiwari; Ranajoy Sadhukhan; Zhuoming Chen; Jinyuan Shi; et al 出版日期:2024-08-20 |
| 求助人 | |
| 下载 | 暂无链接,等待应助者上传 |
|
温馨提示:该文献已被科研通 学术中心 收录,前往查看
科研通『学术中心』是文献索引库,收集文献的基本信息(如标题、摘要、期刊、作者、被引量等),不提供下载功能。如需下载文献全文,请通过文献求助获取。
|