Debiased Sample Selection for Combating Noisy Labels

判别式 计算机科学 选择(遗传算法) 一般化 机器学习 样品(材料) 人工智能 选择偏差 采样(信号处理) 集合(抽象数据类型) 编码(集合论) 取样偏差 班级(哲学) 噪音(视频) 数据挖掘 训练集 样本量测定 统计 数学 图像(数学) 数学分析 滤波器(信号处理) 化学 色谱法 程序设计语言 计算机视觉
作者
Qi Wei,Lei Feng,Haobo Wang,Bo An
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2401.13360
摘要

Learning with noisy labels aims to ensure model generalization given a label-corrupted training set. The sample selection strategy achieves promising performance by selecting a label-reliable subset for model training. In this paper, we empirically reveal that existing sample selection methods suffer from both data and training bias that are represented as imbalanced selected sets and accumulation errors in practice, respectively. However, only the training bias was handled in previous studies. To address this limitation, we propose a noIse-Tolerant Expert Model (ITEM) for debiased learning in sample selection. Specifically, to mitigate the training bias, we design a robust network architecture that integrates with multiple experts. Compared with the prevailing double-branch network, our network exhibits better performance of selection and prediction by ensembling these experts while training with fewer parameters. Meanwhile, to mitigate the data bias, we propose a mixed sampling strategy based on two weight-based data samplers. By training on the mixture of two class-discriminative mini-batches, the model mitigates the effect of the imbalanced training set while avoiding sparse representations that are easily caused by sampling strategies. Extensive experiments and analyses demonstrate the effectiveness of ITEM. Our code is available at this url \href{https://github.com/1998v7/ITEM}{ITEM}.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
一二三发布了新的文献求助10
刚刚
寒冷的新竹关注了科研通微信公众号
1秒前
Ohhruby完成签到,获得积分20
1秒前
Ava应助不氪采纳,获得10
2秒前
3秒前
3秒前
三点完成签到,获得积分10
5秒前
小王完成签到,获得积分10
6秒前
谋勇兼备发布了新的文献求助10
9秒前
跳跃若南完成签到,获得积分10
9秒前
cdercder应助Cici采纳,获得30
10秒前
麦尔丹发布了新的文献求助10
11秒前
knpass完成签到,获得积分10
12秒前
严xixi完成签到 ,获得积分10
12秒前
Semy应助爱科研的小导航采纳,获得10
13秒前
111完成签到,获得积分10
15秒前
16秒前
ZBlll完成签到,获得积分10
17秒前
清秀的仙人掌完成签到,获得积分10
19秒前
20秒前
zhangHR发布了新的文献求助10
20秒前
20秒前
21秒前
谋勇兼备发布了新的文献求助10
21秒前
鸢一折纸完成签到,获得积分10
21秒前
zzh完成签到 ,获得积分10
23秒前
今天进步了吗完成签到,获得积分10
24秒前
wangbo完成签到 ,获得积分10
28秒前
Mrzhao发布了新的文献求助10
28秒前
30秒前
QIXIAO完成签到,获得积分10
30秒前
31秒前
by发布了新的文献求助10
34秒前
omega发布了新的文献求助10
34秒前
34秒前
35秒前
KarryLiu完成签到,获得积分10
36秒前
麦尔丹发布了新的文献求助10
36秒前
Alex发布了新的文献求助10
37秒前
yuaasusanaann发布了新的文献求助10
39秒前
高分求助中
液晶指向矢仿真分析数据集 8888
Invited Discussant 63O and 64O 1000
Ideology and Meaning-Making under the Putin Regime 750
Petrology and Plate Tectonics 500
Writing Systems 500
A Handbook of User Experience Research & Design in Libraries 400
Understanding Modeling and Simulation of Polymerization Reactions 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 计算机科学 化学工程 生物化学 物理 内科学 复合材料 催化作用 光电子学 物理化学 电极 细胞生物学 基因 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6899787
求助须知:如何正确求助?哪些是违规求助? 8594940
关于积分的说明 18247585
捐赠科研通 6299197
什么是DOI,文献DOI怎么找? 3061855
关于科研通互助平台的介绍 2082341
邀请新用户注册赠送积分活动 2039706