Learning to Compose Domain-Specific Transformations for Data Augmentation

领域(数学分析) 计算机科学 数学 数学分析
作者
Alexander Ratner,Henry R. Ehrenberg,Zeshan Hussain,Jared Dunnmon,Christopher Ré
出处
期刊:Cornell University - arXiv 被引量:179
标识
DOI:10.48550/arxiv.1709.01643
摘要

Data augmentation is a ubiquitous technique for increasing the size of labeled training sets by leveraging task-specific data transformations that preserve class labels. While it is often easy for domain experts to specify individual transformations, constructing and tuning the more sophisticated compositions typically needed to achieve state-of-the-art results is a time-consuming manual task in practice. We propose a method for automating this process by learning a generative sequence model over user-specified transformation functions using a generative adversarial approach. Our method can make use of arbitrary, non-deterministic transformation functions, is robust to misspecified user input, and is trained on unlabeled data. The learned transformation model can then be used to perform data augmentation for any end discriminative model. In our experiments, we show the efficacy of our approach on both image and text datasets, achieving improvements of 4.0 accuracy points on CIFAR-10, 1.4 F1 points on the ACE relation extraction task, and 3.4 accuracy points when using domain-specific transformation operations on a medical imaging dataset as compared to standard heuristic augmentation approaches.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
cyz完成签到 ,获得积分10
1秒前
研友_LNM9r8应助tjt采纳,获得10
1秒前
徐谢谢关注了科研通微信公众号
1秒前
pinghu完成签到,获得积分10
1秒前
1秒前
小飞完成签到,获得积分10
1秒前
jjj完成签到,获得积分10
2秒前
慕青应助Forever采纳,获得10
2秒前
小马甲应助八风不动采纳,获得10
2秒前
3秒前
香蕉觅云应助pu采纳,获得10
3秒前
3秒前
乐乐应助Meimei采纳,获得10
4秒前
hzhang0807发布了新的文献求助10
4秒前
小飞发布了新的文献求助10
4秒前
sun发布了新的文献求助10
4秒前
n脑子只想吃完成签到,获得积分10
4秒前
汪爷爷发布了新的文献求助10
5秒前
5秒前
lighting完成签到 ,获得积分10
6秒前
6秒前
Owen应助安静板栗采纳,获得10
7秒前
王博士完成签到,获得积分10
7秒前
yibai99927完成签到,获得积分10
8秒前
yyyyyy完成签到,获得积分10
8秒前
幽默的迎天完成签到,获得积分10
8秒前
8秒前
hanbulashiga完成签到,获得积分10
9秒前
Akim应助礼部尚书采纳,获得10
9秒前
箱子发布了新的文献求助10
9秒前
李健的小迷弟应助快快采纳,获得10
10秒前
小灰灰发布了新的文献求助10
10秒前
阿飞发布了新的文献求助10
10秒前
11秒前
Rober完成签到,获得积分10
11秒前
11秒前
11秒前
12秒前
12秒前
12秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Organometallic Chemistry of the Transition Metals 800
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
The formation of Australian attitudes towards China, 1918-1941 640
Signals, Systems, and Signal Processing 610
全相对论原子结构与含时波包动力学的理论研究--清华大学 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6442296
求助须知:如何正确求助?哪些是违规求助? 8256256
关于积分的说明 17580868
捐赠科研通 5500905
什么是DOI,文献DOI怎么找? 2900487
邀请新用户注册赠送积分活动 1877481
关于科研通互助平台的介绍 1717257