标题 |
![]() 具有DAB结构和重新训练的边缘多模型推理在线调度
|
网址 | |
DOI |
10.1109/INFOCOM55648.2025.11044490
doi
|
其它 |
摘要: 边缘推理应用程序变得越来越复杂,并且由多个模型组成。模型的依赖关系由有向无环图 (DAG) 建模。边缘模型的准确性容易受到数据漂移的影响。采用再训练来维持模型的推理准确性。但是,重新训练的引入使推理请求的任务间依赖关系复杂化。此外,模型重新训练会延长推理完成时间。不同再训练配置下的准确性提高和延迟增加需要在推理精度和请求完成时间之间进行权衡。在本文中,我们研究了带有再训练的多模型推理,旨在最大限度地提高推理准确性,同时最大限度地减少请求完成时间。通过实验分析,我们观察到再训练可以在短时间内提高模型推理的准确性。我们将模型的重新训练任务表示为推理请求的 DAG 中的节点,然后为重新训练和推理任务构建统一的 DAG 结构。我们首先提出了一种具有理论性能保证的单请求调度算法 (SRS),在边缘资源约束下为每个模型选择最优的再训练配置,并共同调度再训练和推理任务。随后,我们将 SRS 扩展到多请求调度算法 (MRS),以解决更通用的在线多请求场景中的调度问题。在边缘系统上的实验表明,与现有方法相比,MRS 可以将推理准确率提高 25%,同时将请求完成时间缩短 45%。 |
求助人 | |
下载 | 暂无链接,等待应助者上传 |