Active Ensemble Learning for Knowledge Graph Error Detection

计算机科学 杠杆(统计) 集成学习 注释 错误检测和纠正 机器学习 知识图 人工智能 集合(抽象数据类型) 图形 光学(聚焦) 算法 理论计算机科学 光学 物理 程序设计语言
作者
Junnan Dong,Qinggang Zhang,Xiao Huang,Qiaoyu Tan,Daochen Zha,Zhao Zihao
标识
DOI:10.1145/3539597.3570368
摘要

Knowledge graphs (KGs) could effectively integrate a large number of real-world assertions, and improve the performance of various applications, such as recommendation and search. KG error detection has been intensively studied since real-world KGs inevitably contain erroneous triples. While existing studies focus on developing a novel algorithm dedicated to one or a few data characteristics, we explore advancing KG error detection by assembling a set of state-of-the-art (SOTA) KG error detectors. However, it is nontrivial to develop a practical ensemble learning framework for KG error detection. Existing ensemble learning models heavily rely on labels, while it is expensive to acquire labeled errors in KGs. Also, KG error detection itself is challenging since triples contain rich semantic information and might be false because of various reasons. To this end, we propose to leverage active learning to minimize human efforts. Our proposed framework - KAEL, could effectively assemble a set of off-the-shelf error detection algorithms, by actively using a limited number of manual annotations. It adaptively updates the ensemble learning policy in each iteration based on active queries, i.e., the answers from experts. After all annotation budget is used, KAEL utilizes the trained policy to identify remaining suspicious triples. Experiments on real-world KGs demonstrate that we can achieve significant improvement when applying KAEL to assemble SOTA error detectors. KAEL also outperforms SOTA ensemble learning baselines significantly.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Wang完成签到,获得积分10
刚刚
Regulus完成签到,获得积分10
刚刚
刚刚
嫣然完成签到 ,获得积分10
刚刚
高兴的柚子完成签到 ,获得积分10
刚刚
专虐白榨菜完成签到,获得积分10
刚刚
刚刚
任性的雁枫完成签到,获得积分10
1秒前
桐桐应助害羞破茧采纳,获得10
1秒前
土豆泥拉拉完成签到,获得积分10
1秒前
whg完成签到,获得积分10
1秒前
Aileen完成签到,获得积分10
2秒前
www完成签到 ,获得积分10
2秒前
瞿访云完成签到,获得积分10
2秒前
Nhyyy完成签到,获得积分10
3秒前
CC关闭了CC文献求助
3秒前
Ann发布了新的文献求助10
4秒前
1016完成签到,获得积分10
5秒前
深情沧海完成签到,获得积分10
6秒前
6秒前
7788完成签到,获得积分10
6秒前
安利完成签到,获得积分10
6秒前
6秒前
瑞泽关注了科研通微信公众号
7秒前
彩色的幻天完成签到,获得积分10
7秒前
zszzzsss发布了新的文献求助10
7秒前
源孤律醒发布了新的文献求助100
7秒前
小马想毕业完成签到,获得积分10
7秒前
粥游天下完成签到,获得积分10
7秒前
科研人完成签到,获得积分10
7秒前
memory应助小宝采纳,获得10
8秒前
超级涔发布了新的文献求助10
8秒前
seed85完成签到,获得积分10
8秒前
9秒前
巴山郎完成签到,获得积分10
9秒前
Owen应助1111chen采纳,获得10
10秒前
10秒前
ZMH完成签到,获得积分10
10秒前
任夏完成签到,获得积分10
10秒前
feixue完成签到,获得积分10
11秒前
高分求助中
Malcolm Fraser : a biography 680
Signals, Systems, and Signal Processing 610
天津市智库成果选编 600
Climate change and sports: Statistics report on climate change and sports 500
Forced degradation and stability indicating LC method for Letrozole: A stress testing guide 500
Organic Reactions Volume 118 400
A Foreign Missionary on the Long March: The Unpublished Memoirs of Arnolis Hayman of the China Inland Mission 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6459492
求助须知:如何正确求助?哪些是违规求助? 8268526
关于积分的说明 17622801
捐赠科研通 5528809
什么是DOI,文献DOI怎么找? 2905931
邀请新用户注册赠送积分活动 1882676
关于科研通互助平台的介绍 1727899