Debiased Sample Selection for Combating Noisy Labels

判别式 计算机科学 选择(遗传算法) 一般化 机器学习 样品(材料) 人工智能 选择偏差 采样(信号处理) 集合(抽象数据类型) 编码(集合论) 取样偏差 班级(哲学) 噪音(视频) 数据挖掘 训练集 样本量测定 统计 数学 化学 色谱法 数学分析 滤波器(信号处理) 图像(数学) 计算机视觉 程序设计语言
作者
Qi Wei,Lei Feng,Haobo Wang,Bo An
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2401.13360
摘要

Learning with noisy labels aims to ensure model generalization given a label-corrupted training set. The sample selection strategy achieves promising performance by selecting a label-reliable subset for model training. In this paper, we empirically reveal that existing sample selection methods suffer from both data and training bias that are represented as imbalanced selected sets and accumulation errors in practice, respectively. However, only the training bias was handled in previous studies. To address this limitation, we propose a noIse-Tolerant Expert Model (ITEM) for debiased learning in sample selection. Specifically, to mitigate the training bias, we design a robust network architecture that integrates with multiple experts. Compared with the prevailing double-branch network, our network exhibits better performance of selection and prediction by ensembling these experts while training with fewer parameters. Meanwhile, to mitigate the data bias, we propose a mixed sampling strategy based on two weight-based data samplers. By training on the mixture of two class-discriminative mini-batches, the model mitigates the effect of the imbalanced training set while avoiding sparse representations that are easily caused by sampling strategies. Extensive experiments and analyses demonstrate the effectiveness of ITEM. Our code is available at this url \href{https://github.com/1998v7/ITEM}{ITEM}.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
黎敏发布了新的文献求助10
1秒前
ZHQ完成签到,获得积分10
1秒前
18318933768完成签到,获得积分10
2秒前
Brief完成签到,获得积分10
2秒前
薛得豪完成签到,获得积分10
2秒前
CYT完成签到,获得积分10
3秒前
上帝的宠儿完成签到,获得积分10
5秒前
研友_ZA2B68完成签到,获得积分0
6秒前
风信子完成签到,获得积分10
6秒前
fate8680完成签到,获得积分10
6秒前
研友_nvebxL完成签到,获得积分10
7秒前
量子星尘发布了新的文献求助10
8秒前
BK_201完成签到,获得积分10
9秒前
Helios完成签到,获得积分10
10秒前
abiorz完成签到,获得积分0
10秒前
窗外是蔚蓝色完成签到,获得积分0
11秒前
hooddy123459发布了新的文献求助10
11秒前
安安应助科研通管家采纳,获得10
12秒前
田様应助科研通管家采纳,获得10
12秒前
无花果应助科研通管家采纳,获得10
12秒前
shtatbf应助科研通管家采纳,获得10
12秒前
李爱国应助科研通管家采纳,获得10
12秒前
华仔应助科研通管家采纳,获得30
12秒前
shtatbf应助科研通管家采纳,获得10
12秒前
alter_mu应助科研通管家采纳,获得30
12秒前
彭于晏应助科研通管家采纳,获得10
12秒前
搜集达人应助科研通管家采纳,获得10
12秒前
星辰大海应助科研通管家采纳,获得10
13秒前
WonderHua完成签到,获得积分10
14秒前
nssanc完成签到,获得积分10
14秒前
Amikacin完成签到,获得积分10
14秒前
鹏举瞰冷雨完成签到,获得积分10
14秒前
健壮洋葱完成签到 ,获得积分10
14秒前
Noshore完成签到,获得积分10
14秒前
量子星尘发布了新的文献求助10
15秒前
张牧之完成签到 ,获得积分10
17秒前
跳跃的语柔完成签到 ,获得积分10
18秒前
量子星尘发布了新的文献求助10
19秒前
Cenhuan完成签到,获得积分10
19秒前
YANBINGHANG完成签到,获得积分10
21秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Binary Alloy Phase Diagrams, 2nd Edition 8000
Building Quantum Computers 800
Translanguaging in Action in English-Medium Classrooms: A Resource Book for Teachers 700
Natural Product Extraction: Principles and Applications 500
Exosomes Pipeline Insight, 2025 500
Qualitative Data Analysis with NVivo By Jenine Beekhuyzen, Pat Bazeley · 2024 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5664764
求助须知:如何正确求助?哪些是违规求助? 4869628
关于积分的说明 15108640
捐赠科研通 4823481
什么是DOI,文献DOI怎么找? 2582379
邀请新用户注册赠送积分活动 1536429
关于科研通互助平台的介绍 1494858