DeepFT: Fault-Tolerant Edge Computing using a Self-Supervised Deep Surrogate Model

计算机科学 边缘计算 人工智能 机器学习 GSM演进的增强数据速率 容错 调度(生产过程) 可靠性(半导体) 延迟(音频) 故障检测与隔离 分布式计算 深度学习 数据挖掘 工程类 功率(物理) 运营管理 物理 电信 量子力学 执行机构
作者
Shreshth Tuli,Giuliano Casale,Ludmila Cherkasova,Nicholas R. Jennings
标识
DOI:10.1109/infocom53939.2023.10229049
摘要

The emergence of latency-critical AI applications has been supported by the evolution of the edge computing paradigm. However, edge solutions are typically resource-constrained, posing reliability challenges due to heightened contention for compute capacities and faulty application behavior in the presence of overload conditions. Although a large amount of generated log data can be mined for fault prediction, labeling this data for training is a manual process and thus a limiting factor for automation. Due to this, many companies resort to unsupervised fault-tolerance models. Yet, failure models of this kind can incur a loss of accuracy when they need to adapt to non-stationary workloads and diverse host characteristics. Thus, we propose a novel modeling approach, DeepFT, to proactively avoid system overloads and their adverse effects by optimizing the task scheduling decisions. DeepFT uses a deep-surrogate model to accurately predict and diagnose faults in the system and co-simulation based self-supervised learning to dynamically adapt the model in volatile settings. Experimentation on an edge cluster shows that DeepFT can outperform state-of-the-art methods in fault-detection and QoS metrics. Specifically, DeepFT gives the highest F1 scores for fault-detection, reducing service deadline violations by up to 37% while also improving response time by up to 9%.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
万能图书馆应助YANGJIE6采纳,获得10
4秒前
smile~完成签到,获得积分20
6秒前
yi关注了科研通微信公众号
6秒前
栀然完成签到,获得积分10
6秒前
Mr.Li完成签到,获得积分10
7秒前
9秒前
11秒前
奋斗的忆南完成签到,获得积分10
12秒前
陶醉觅夏发布了新的文献求助10
13秒前
李健应助Arthur采纳,获得10
14秒前
15秒前
16秒前
YANGJIE6发布了新的文献求助10
17秒前
无尘发布了新的文献求助10
20秒前
xiazhq完成签到,获得积分10
22秒前
唠叨的白萱完成签到,获得积分10
22秒前
yzh完成签到,获得积分10
22秒前
22秒前
YANGJIE6完成签到,获得积分10
24秒前
24秒前
25秒前
ddd发布了新的文献求助20
25秒前
Arthur发布了新的文献求助10
30秒前
EdinLiv发布了新的文献求助30
31秒前
31秒前
32秒前
33秒前
wanci应助糟糕的彩虹采纳,获得10
35秒前
飞飞888发布了新的文献求助10
36秒前
38秒前
muzi发布了新的文献求助10
39秒前
39秒前
871624521发布了新的文献求助10
39秒前
39秒前
yzh发布了新的文献求助10
39秒前
卑微老大完成签到 ,获得积分10
40秒前
41秒前
挽风完成签到,获得积分10
42秒前
skyline发布了新的文献求助10
43秒前
gao发布了新的文献求助10
45秒前
高分求助中
Thermodynamic data for steelmaking 3000
Counseling With Immigrants, Refugees, and Their Families From Social Justice Perspectives pages 800
Electrochemistry 500
Statistical Procedures for the Medical Device Industry 400
藍からはじまる蛍光性トリプタンスリン研究 400
Cardiology: Board and Certification Review 400
A History of the Global Economy 350
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2367272
求助须知:如何正确求助?哪些是违规求助? 2076333
关于积分的说明 5193881
捐赠科研通 1803407
什么是DOI,文献DOI怎么找? 900527
版权声明 558009
科研通“疑难数据库(出版商)”最低求助积分说明 480549