Neighborhood Weighted Voting-Based Noise Correction for Crowdsourcing

众包 噪音(视频) 多数决原则 计算机科学 基本事实 人工智能 公制(单位) 推论 集合(抽象数据类型) 滤波器(信号处理) 投票 机器学习 噪声测量 特征(语言学) 模式识别(心理学) 数据挖掘 算法 降噪 计算机视觉 图像(数学) 程序设计语言 法学 万维网 经济 哲学 政治 语言学 运营管理 政治学
作者
Huiru Li,Liangxiao Jiang,Siqing Xue
出处
期刊:ACM Transactions on Knowledge Discovery From Data [Association for Computing Machinery]
卷期号:17 (7): 1-18 被引量:13
标识
DOI:10.1145/3586998
摘要

In crowdsourcing scenarios, we can obtain each instance’s multiple noisy labels set from different crowd workers and then use a ground truth inference algorithm to infer its integrated label. Despite the effectiveness of ground truth inference algorithms, a certain level of noise still remains in the integrated labels. To reduce the impact of noise, many noise correction algorithms have been proposed in recent years. To the best of our knowledge, however, nearly all existing noise correction algorithms only exploit each instance’s own multiple noisy label sets but ignore the multiple noisy label sets of its neighbors. Here neighbors refer to the nearest instances found in the feature space based on the distance metric learning. In this article, we propose neighborhood weighted voting-based noise correction (NWVNC). In NWVNC, we at first take advantage of the multiple noisy label sets of each instance’s neighbors (including itself) to estimate the probability that it belongs to its integrated label. Then, we use the estimated probability to identify and filter noise instances and thus obtain a clean set and a noise set. Finally, we train three heterogeneous classifiers on the clean set and correct the noise instances by the consensus voting of three trained classifiers. The experimental results on 34 simulated and two real-world crowdsourced datasets show that NWVNC significantly outperforms all the other state-of-the-art noise correction algorithms used for comparison.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
科研菜j发布了新的文献求助10
刚刚
2052669099发布了新的文献求助10
刚刚
刚刚
刚刚
旋转蒸发完成签到,获得积分20
1秒前
1秒前
科研通AI6.2应助123采纳,获得30
2秒前
3秒前
种棵糖葫芦树完成签到 ,获得积分10
3秒前
3秒前
3秒前
楠木木发布了新的文献求助10
4秒前
小王很幸福完成签到,获得积分10
4秒前
zjh发布了新的文献求助10
5秒前
6秒前
墨琼琼发布了新的文献求助10
6秒前
6秒前
伊登发布了新的文献求助10
6秒前
spurt发布了新的文献求助10
7秒前
ymk完成签到,获得积分10
7秒前
友好春天完成签到,获得积分10
7秒前
Artorias应助windyc采纳,获得10
7秒前
zxy发布了新的文献求助10
7秒前
archer01发布了新的文献求助10
7秒前
8秒前
NiuY发布了新的文献求助10
9秒前
9秒前
科研通AI6.3应助zl采纳,获得10
9秒前
乐空思应助小余采纳,获得50
9秒前
HAHAlyy完成签到,获得积分10
10秒前
10秒前
10秒前
bkagyin应助偷酒的馒头猫采纳,获得10
11秒前
shayila发布了新的文献求助10
11秒前
doller应助壮观手套采纳,获得10
11秒前
希望完成签到,获得积分10
11秒前
11秒前
科研通AI6.3应助王金金采纳,获得10
11秒前
木子李1992发布了新的文献求助20
13秒前
科研通AI6.3应助heisproton采纳,获得10
13秒前
高分求助中
The Wiley Blackwell Companion to Diachronic and Historical Linguistics 3000
HANDBOOK OF CHEMISTRY AND PHYSICS 106th edition 1000
ASPEN Adult Nutrition Support Core Curriculum, Fourth Edition 1000
Decentring Leadership 800
Signals, Systems, and Signal Processing 610
脑电大模型与情感脑机接口研究--郑伟龙 500
Genera Orchidacearum Volume 4: Epidendroideae, Part 1 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6288726
求助须知:如何正确求助?哪些是违规求助? 8107232
关于积分的说明 16959937
捐赠科研通 5353603
什么是DOI,文献DOI怎么找? 2844829
邀请新用户注册赠送积分活动 1822068
关于科研通互助平台的介绍 1678156