Neighborhood Weighted Voting-Based Noise Correction for Crowdsourcing

众包 噪音(视频) 多数决原则 计算机科学 基本事实 人工智能 公制(单位) 推论 集合(抽象数据类型) 滤波器(信号处理) 投票 机器学习 噪声测量 特征(语言学) 模式识别(心理学) 数据挖掘 算法 降噪 计算机视觉 图像(数学) 程序设计语言 法学 万维网 经济 哲学 政治 语言学 运营管理 政治学
作者
Huiru Li,Liangxiao Jiang,Siqing Xue
出处
期刊:ACM Transactions on Knowledge Discovery From Data [Association for Computing Machinery]
卷期号:17 (7): 1-18 被引量:13
标识
DOI:10.1145/3586998
摘要

In crowdsourcing scenarios, we can obtain each instance’s multiple noisy labels set from different crowd workers and then use a ground truth inference algorithm to infer its integrated label. Despite the effectiveness of ground truth inference algorithms, a certain level of noise still remains in the integrated labels. To reduce the impact of noise, many noise correction algorithms have been proposed in recent years. To the best of our knowledge, however, nearly all existing noise correction algorithms only exploit each instance’s own multiple noisy label sets but ignore the multiple noisy label sets of its neighbors. Here neighbors refer to the nearest instances found in the feature space based on the distance metric learning. In this article, we propose neighborhood weighted voting-based noise correction (NWVNC). In NWVNC, we at first take advantage of the multiple noisy label sets of each instance’s neighbors (including itself) to estimate the probability that it belongs to its integrated label. Then, we use the estimated probability to identify and filter noise instances and thus obtain a clean set and a noise set. Finally, we train three heterogeneous classifiers on the clean set and correct the noise instances by the consensus voting of three trained classifiers. The experimental results on 34 simulated and two real-world crowdsourced datasets show that NWVNC significantly outperforms all the other state-of-the-art noise correction algorithms used for comparison.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
科研通AI2S应助寒冷的友梅采纳,获得10
2秒前
婧婧发布了新的文献求助10
3秒前
科研通AI6.3应助LN采纳,获得10
4秒前
1234567890完成签到,获得积分10
4秒前
4秒前
4秒前
ZhuoCui完成签到,获得积分10
5秒前
5秒前
galvin发布了新的文献求助30
5秒前
jiaxlnn完成签到,获得积分20
5秒前
小林发布了新的文献求助10
5秒前
lq完成签到,获得积分10
5秒前
6秒前
科研通AI6.4应助fxx采纳,获得10
6秒前
6秒前
scx发布了新的文献求助10
6秒前
上官若男应助ailsa采纳,获得10
6秒前
xiu完成签到,获得积分10
6秒前
三寸日光发布了新的文献求助10
7秒前
8秒前
科研小白完成签到,获得积分10
8秒前
8秒前
8秒前
Orange应助落泪静殇采纳,获得10
8秒前
chiyu完成签到,获得积分10
8秒前
Ju1es完成签到,获得积分10
8秒前
元元元发布了新的文献求助10
9秒前
10秒前
10秒前
yyy发布了新的文献求助10
11秒前
桐桐应助酷炫灵安采纳,获得10
11秒前
11秒前
DamenS发布了新的文献求助10
11秒前
拽拽也是猫猫完成签到,获得积分10
11秒前
12秒前
bobopoi完成签到,获得积分10
12秒前
伊莱le发布了新的文献求助10
12秒前
麻辣香锅发布了新的文献求助10
12秒前
你干嘛发布了新的文献求助10
12秒前
高分求助中
The Wiley Blackwell Companion to Diachronic and Historical Linguistics 3000
HANDBOOK OF CHEMISTRY AND PHYSICS 106th edition 1000
ASPEN Adult Nutrition Support Core Curriculum, Fourth Edition 1000
AnnualResearch andConsultation Report of Panorama survey and Investment strategy onChinaIndustry 1000
Decentring Leadership 800
Signals, Systems, and Signal Processing 610
GMP in Practice: Regulatory Expectations for the Pharmaceutical Industry 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6287047
求助须知:如何正确求助?哪些是违规求助? 8105925
关于积分的说明 16953898
捐赠科研通 5352282
什么是DOI,文献DOI怎么找? 2844409
邀请新用户注册赠送积分活动 1821627
关于科研通互助平台的介绍 1677983