A benchmark and survey of fully unsupervised concept drift detectors on real-world data streams

水准点(测量) 数据流挖掘 溪流 计算机科学 概念漂移 探测器 数据流 数据挖掘 实时计算 地理 电信 地图学 计算机网络
作者
Daniel Lukats,Oliver Zielinski,Axel Hahn,Frederic Stahl
出处
期刊:International journal of data science and analytics [Springer International Publishing]
被引量:3
标识
DOI:10.1007/s41060-024-00620-y
摘要

Concept drift detection techniques can be used to discover substantial changes of the patterns encoded in data streams in real-time. If left unaddressed, these changes can render deployed machine learning models unreliable because their training data no longer matches the patterns present in the data stream. Most algorithms proposed in the literature depend on the immediate availability of ground truth class labels. This is unrealistic for many applications due to the associated cost of labeling. Therefore, this study reviews the availability of fully unsupervised concept drift detectors, which can operate entirely without labeled data. Ten algorithms are analyzed in terms of architectural choices, core ideas and assumptions about data because they fulfilled several inclusion criteria designed to ensure faithful and reliable implementations. Seven of these algorithms are evaluated with common concept drift detection metrics on eleven real-world data streams; the remaining three performed too slow or depended on chance. Based on the results of these experiments, three concept drift detectors—Discriminative Drift Detector, Image-Based Drift Detector and Semi-Parametric Log-Likelihood—can be recommended depending on the desired target metric. This study further reveals issues with the evaluation metrics Mean Time Ratio and lift-per-drift. Finally, it highlights open research challenges.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
天荻荏发布了新的文献求助10
1秒前
2秒前
满意的小蚂蚁完成签到,获得积分10
5秒前
ddd完成签到,获得积分10
6秒前
天荻荏完成签到,获得积分10
9秒前
李健的小迷弟应助ohen67采纳,获得10
9秒前
10秒前
打打应助ETA采纳,获得10
11秒前
12秒前
13秒前
愫浅完成签到 ,获得积分10
14秒前
杨朝阳发布了新的文献求助10
15秒前
科研通AI6.4应助赵佳楠采纳,获得10
15秒前
ZHU发布了新的文献求助10
16秒前
sk夏冰完成签到 ,获得积分10
16秒前
17秒前
17秒前
17秒前
chipmunk完成签到,获得积分10
20秒前
20秒前
21秒前
23秒前
852应助Cannonball采纳,获得10
23秒前
Bassvv发布了新的文献求助10
24秒前
晚生发布了新的文献求助10
24秒前
SciGPT应助光亮归尘采纳,获得10
25秒前
所所应助默默采纳,获得10
25秒前
凌凌发布了新的文献求助10
27秒前
所所应助EIEITY采纳,获得10
27秒前
27秒前
31秒前
31秒前
32秒前
YANA完成签到,获得积分10
33秒前
33秒前
ohen67发布了新的文献求助10
34秒前
科研通AI6.2应助群青采纳,获得10
34秒前
Cannonball发布了新的文献求助10
35秒前
fjl发布了新的文献求助10
36秒前
feier完成签到,获得积分10
36秒前
高分求助中
Principles of Economics, 11th Edition 10000
Prescott's Microbiology: 2026 Release ISE 10000
University Physics with Modern Physics, 16th edition 10000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Environmental Leverage in Times of Climate Crisis: Product Standards, Carbon Border Measures and Preferential Trade Agreements 1000
Interactions of Vowel Quality and Prosody in East Slavic 1000
Erwählung und Berufung bei Paulus: Bedeutung, Entwicklung und Funktion einer Vorstellung in ihrem frühjüdischen und griechisch-römischen Kontext 850
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 内科学 物理 复合材料 催化作用 细胞生物学 无机化学 光电子学 物理化学 电极 基因
热门帖子
关注 科研通微信公众号,转发送积分 7177247
求助须知:如何正确求助?哪些是违规求助? 8817115
关于积分的说明 18625591
捐赠科研通 6797598
什么是DOI,文献DOI怎么找? 3169850
关于科研通互助平台的介绍 2314133
邀请新用户注册赠送积分活动 2144591