| 标题 |
CacheGen: KV Cache Compression and Streaming for Fast Large Language Model Serving |
| 网址 | |
| DOI | |
| 其它 |
期刊:Proceedings of the ACM SIGCOMM 2024 Conference 作者:Yuhan Liu; Hanchen Li; Yihua Cheng; Siddhant Ray; Yuyang Huang; et al 出版日期:2024-07-31 |
| 求助人 | |
| 下载 | 该求助完结已超 24 小时,文件已从服务器自动删除,无法下载。 |
PDF的下载单位、IP信息已删除
(2025-6-4)