Revisiting Deep Learning Models for Tabular Data

计算机科学 深度学习 建筑 机器学习 基线(sea) 人工智能 简单(哲学) 适应(眼睛) 领域(数学) 变压器 航程(航空) 数据挖掘 集合(抽象数据类型) 域适应 数据科学 地质学 纯数学 物理 程序设计语言 分类器(UML) 量子力学 认识论 视觉艺术 复合材料 光学 海洋学 电压 数学 材料科学 哲学 艺术
作者
Yury Gorishniy,Ivan Rubachev,Valentin Khrulkov,Artem Babenko
出处
期刊:Cornell University - arXiv 被引量:116
标识
DOI:10.48550/arxiv.2106.11959
摘要

The existing literature on deep learning for tabular data proposes a wide range of novel architectures and reports competitive results on various datasets. However, the proposed models are usually not properly compared to each other and existing works often use different benchmarks and experiment protocols. As a result, it is unclear for both researchers and practitioners what models perform best. Additionally, the field still lacks effective baselines, that is, the easy-to-use models that provide competitive performance across different problems. In this work, we perform an overview of the main families of DL architectures for tabular data and raise the bar of baselines in tabular DL by identifying two simple and powerful deep architectures. The first one is a ResNet-like architecture which turns out to be a strong baseline that is often missing in prior works. The second model is our simple adaptation of the Transformer architecture for tabular data, which outperforms other solutions on most tasks. Both models are compared to many existing architectures on a diverse set of tasks under the same training and tuning protocols. We also compare the best DL models with Gradient Boosted Decision Trees and conclude that there is still no universally superior solution.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Spine脊柱发布了新的文献求助10
刚刚
刚刚
宋敬辉完成签到,获得积分10
4秒前
elegant122完成签到,获得积分10
5秒前
5秒前
5秒前
6秒前
Khaoros发布了新的文献求助10
7秒前
科目三应助Spine脊柱采纳,获得10
8秒前
懒杨杨完成签到,获得积分10
9秒前
9秒前
今后应助任俊凯采纳,获得10
9秒前
9秒前
aurora完成签到,获得积分10
10秒前
OrthoDW完成签到,获得积分10
10秒前
方班术完成签到,获得积分10
11秒前
lunhui6453发布了新的文献求助10
11秒前
11秒前
111111发布了新的文献求助10
11秒前
11秒前
CHUAN完成签到 ,获得积分10
11秒前
venkash发布了新的文献求助10
11秒前
13秒前
陈亮发布了新的文献求助10
13秒前
科目三应助L晨晨采纳,获得10
14秒前
双子土豆泥完成签到 ,获得积分10
14秒前
TTw发布了新的文献求助10
15秒前
16秒前
卫化蛹发布了新的文献求助10
16秒前
华仔应助!!采纳,获得10
18秒前
gg完成签到,获得积分10
18秒前
穿西装的小卡完成签到 ,获得积分10
18秒前
18秒前
venkash完成签到,获得积分10
19秒前
19秒前
Tingshan发布了新的文献求助10
20秒前
20秒前
20秒前
21秒前
22秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Leading Academic-Practice Partnerships in Nursing and Healthcare: A Paradigm for Change 800
Signals, Systems, and Signal Processing 610
Research Methods for Business: A Skill Building Approach, 9th Edition 500
Research Methods for Applied Linguistics 500
Picture Books with Same-sex Parented Families Unintentional Censorship 444
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6413162
求助须知:如何正确求助?哪些是违规求助? 8232122
关于积分的说明 17473266
捐赠科研通 5465869
什么是DOI,文献DOI怎么找? 2887979
邀请新用户注册赠送积分活动 1864715
关于科研通互助平台的介绍 1703084