SLiMFast: Guaranteed Results for Data Fusion and Source Reliability

判别式 计算机科学 概率逻辑 机器学习 传感器融合 可靠性(半导体) 人工智能 生成模型 光学(聚焦) 领域(数学分析) 融合 数据挖掘 代表(政治) 统计模型 生成语法 数学 光学 物理 政治 数学分析 哲学 量子力学 语言学 功率(物理) 法学 政治学
作者
Manas Joglekar,Θεόδωρος Ρεκατσίνας,Héctor García-Molina,Aditya Parameswaran,Christopher Ré
出处
期刊:Cornell University - arXiv 被引量:1
摘要

We focus on data fusion, i.e., the problem of unifying conflicting data from data sources into a single representation by estimating the source accuracies. We propose SLiMFast, a framework that expresses data fusion as a statistical learning problem over discriminative probabilistic models, which in many cases correspond to logistic regression. In contrast to previous approaches that use complex generative models, discriminative models make fewer distributional assumptions over data sources and allow us to obtain rigorous theoretical guarantees. Furthermore, we show how SLiMFast enables incorporating domain knowledge into data fusion, yielding accuracy improvements of up to 50\% over state-of-the-art baselines. Building upon our theoretical results, we design an optimizer that obviates the need for users to manually select an algorithm for learning SLiMFast's parameters. We validate our optimizer on multiple real-world datasets and show that it can accurately predict the learning algorithm that yields the best data fusion results.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
完美世界应助科研通管家采纳,获得10
2秒前
Maestro_S应助科研通管家采纳,获得30
2秒前
深情安青应助科研通管家采纳,获得10
2秒前
CodeCraft应助科研通管家采纳,获得10
2秒前
丘比特应助科研通管家采纳,获得10
2秒前
思源应助科研通管家采纳,获得10
2秒前
柒易桉应助科研通管家采纳,获得10
2秒前
隐形曼青应助科研通管家采纳,获得10
2秒前
情怀应助科研通管家采纳,获得10
2秒前
wufel完成签到,获得积分10
4秒前
我的南方完成签到,获得积分10
5秒前
8秒前
wufel2完成签到,获得积分10
12秒前
易大人完成签到 ,获得积分10
15秒前
ffchen111完成签到 ,获得积分10
21秒前
言无间完成签到 ,获得积分10
23秒前
23秒前
西早07完成签到,获得积分10
25秒前
留胡子的如花完成签到,获得积分10
31秒前
小木虫完成签到 ,获得积分10
34秒前
Maestro_S完成签到,获得积分0
34秒前
魏晓林完成签到,获得积分10
35秒前
周振凯完成签到,获得积分10
37秒前
细胞疗法搬砖工完成签到,获得积分10
40秒前
圆圈儿完成签到,获得积分10
42秒前
43秒前
yzxzdm完成签到 ,获得积分10
46秒前
龙斯琪完成签到 ,获得积分10
48秒前
99发布了新的文献求助10
49秒前
勿昂完成签到 ,获得积分10
52秒前
52秒前
酷炫小猫咪完成签到,获得积分10
53秒前
55秒前
彭于晏应助ccchengzi采纳,获得10
55秒前
55秒前
56秒前
贺万万发布了新的文献求助10
57秒前
如意山槐发布了新的文献求助10
1分钟前
可可西里完成签到 ,获得积分10
1分钟前
1分钟前
高分求助中
The Illustrated History of Gymnastics 800
The Bourse of Babylon : market quotations in the astronomical diaries of Babylonia 680
Division and square root. Digit-recurrence algorithms and implementations 500
機能營養學前瞻(3 Ed.) 300
Problems of transcultural communication 300
Zwischen Selbstbestimmung und Selbstbehauptung 300
Physics of semiconductor devices 200
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2506298
求助须知:如何正确求助?哪些是违规求助? 2158084
关于积分的说明 5524058
捐赠科研通 1878735
什么是DOI,文献DOI怎么找? 934389
版权声明 564027
科研通“疑难数据库(出版商)”最低求助积分说明 499117