Handling incomplete heterogeneous data using VAEs

范畴变量 计算机科学 缺少数据 插补(统计学) 人工智能 数据挖掘 机器学习
作者
Alfredo Nazábal,Pablo M. Olmos,Zoubin Ghahramani,Isabel Valera
出处
期刊:Pattern Recognition [Elsevier BV]
卷期号:107: 107501-107501 被引量:235
标识
DOI:10.1016/j.patcog.2020.107501
摘要

Variational autoencoders (VAEs), as well as other generative models, have been shown to be efficient and accurate for capturing the latent structure of vast amounts of complex high-dimensional data. However, existing VAEs can still not directly handle data that are heterogenous (mixed continuous and discrete) or incomplete (with missing data at random), which is indeed common in real-world applications. In this paper, we propose a general framework to design VAEs suitable for fitting incomplete heterogenous data. The proposed HI-VAE includes likelihood models for real-valued, positive real valued, interval, categorical, ordinal and count data, and allows accurate estimation (and potentially imputation) of missing data. Furthermore, HI-VAE presents competitive predictive performance in supervised tasks, outperforming supervised models when trained on incomplete data.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
灯座完成签到,获得积分10
4秒前
6秒前
13633501455完成签到 ,获得积分10
19秒前
ada阿达完成签到,获得积分10
25秒前
江南第八完成签到,获得积分10
28秒前
曾经不言完成签到 ,获得积分10
36秒前
辣椒完成签到,获得积分10
39秒前
Zb完成签到 ,获得积分10
39秒前
科目三应助科研通管家采纳,获得10
40秒前
40秒前
醒了没醒醒完成签到 ,获得积分10
40秒前
jiangjiang完成签到 ,获得积分10
46秒前
lhn完成签到 ,获得积分10
55秒前
权秋尽完成签到,获得积分10
58秒前
aixiaoyu完成签到 ,获得积分10
1分钟前
无言完成签到 ,获得积分10
1分钟前
拓小八完成签到,获得积分0
1分钟前
笔墨纸砚完成签到 ,获得积分10
1分钟前
碗碗豆喵完成签到 ,获得积分10
1分钟前
1分钟前
chenying完成签到 ,获得积分0
1分钟前
yx完成签到 ,获得积分10
1分钟前
KhanhVy发布了新的文献求助10
1分钟前
忧虑的静柏完成签到 ,获得积分10
1分钟前
guhao完成签到 ,获得积分10
1分钟前
小羊咩完成签到,获得积分0
1分钟前
506407完成签到,获得积分10
1分钟前
wonwojo完成签到 ,获得积分10
1分钟前
麦田麦兜完成签到,获得积分10
1分钟前
笛卡尔的情书完成签到 ,获得积分10
1分钟前
1分钟前
KhanhVy完成签到,获得积分10
1分钟前
勤qin完成签到 ,获得积分10
1分钟前
甜叶菊发布了新的文献求助10
1分钟前
婉莹完成签到 ,获得积分10
1分钟前
薄荷心完成签到 ,获得积分10
1分钟前
诺亚方舟哇哈哈完成签到 ,获得积分0
1分钟前
1分钟前
吃的饱饱呀完成签到 ,获得积分10
1分钟前
vitamin完成签到 ,获得积分0
2分钟前
高分求助中
Adhesion Science: Principles & Practice 1234
Signals, Systems, and Signal Processing 610
Inflectional Morphology in Harmonic Serialism 600
Competition Law: Cases and Materials, 5th edition 500
Petrology and Plate Tectonics,2025 400
Burger's Medicinal Chemistry and Drug Discovery 400
A Step-by-Step Guide to Qualitative Data Coding 2nd Edition 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6711218
求助须知:如何正确求助?哪些是违规求助? 8450524
关于积分的说明 18042687
捐赠科研通 5956657
什么是DOI,文献DOI怎么找? 2992963
邀请新用户注册赠送积分活动 1968892
关于科研通互助平台的介绍 1918274