A theoretically grounded application of dropout in recurrent neural networks

辍学(神经网络) 困惑 计算机科学 人工智能 过度拟合 机器学习 深度学习 推论 语言模型 循环神经网络 贝叶斯推理 人工神经网络 贝叶斯概率
作者
Yarin Gal,Zoubin Ghahramani
出处
期刊:Neural Information Processing Systems 卷期号:29: 1027-1035 被引量:1027
链接
摘要

Recurrent neural networks (RNNs) stand at the forefront of many recent developments in deep learning. Yet a major difficulty with these models is their tendency to overfit, with dropout shown to fail when applied to recurrent layers. Recent results at the intersection of Bayesian modelling and deep learning offer a Bayesian interpretation of common deep learning techniques such as dropout. This grounding of dropout in approximate Bayesian inference suggests an extension of the theoretical results, offering insights into the use of dropout with RNN models. We apply this new variational inference based dropout technique in LSTM and GRU models, assessing it on language modelling and sentiment analysis tasks. The new approach outperforms existing techniques, and to the best of our knowledge improves on the single model state-of-the-art in language modelling with the Penn Treebank (73.4 test perplexity). This extends our arsenal of variational tools in deep learning.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
虾条完成签到,获得积分10
2秒前
小二郎应助谦让夜香采纳,获得10
3秒前
番茄小姐完成签到,获得积分10
3秒前
3秒前
4秒前
SYLH应助幽默宛亦采纳,获得10
7秒前
巫马笑天完成签到 ,获得积分10
7秒前
小杨同学发布了新的文献求助10
9秒前
Mine发布了新的文献求助10
9秒前
高兴不尤完成签到,获得积分10
10秒前
所所应助易安采纳,获得10
10秒前
徐诣博完成签到,获得积分20
11秒前
二三语逢山外山2完成签到 ,获得积分10
12秒前
巫马谷南完成签到,获得积分10
13秒前
11驳回了酷波er应助
13秒前
搜集达人应助真实的半邪采纳,获得10
16秒前
一颗小洋葱完成签到 ,获得积分10
17秒前
徐诣博发布了新的文献求助10
18秒前
科研通AI2S应助fjhsg25采纳,获得10
18秒前
18秒前
19秒前
JamesPei应助你好采纳,获得30
20秒前
幽默宛亦完成签到,获得积分10
21秒前
21秒前
一帆风顺发布了新的文献求助50
23秒前
小太阳完成签到,获得积分10
23秒前
jingerous发布了新的文献求助10
25秒前
李鹏辉完成签到 ,获得积分10
26秒前
陌上无人扰完成签到,获得积分10
26秒前
桃紫完成签到,获得积分10
26秒前
旺仔完成签到 ,获得积分10
27秒前
紧张的寒梦完成签到 ,获得积分20
27秒前
30秒前
刘欢发布了新的文献求助10
31秒前
科研通AI5应助jingerous采纳,获得10
32秒前
32秒前
33秒前
34秒前
斯文败类应助Hongyan采纳,获得10
34秒前
高分求助中
Thinking Small and Large 500
Algorithmic Mathematics in Machine Learning 500
Handbook of Innovations in Political Psychology 400
Mapping the Stars: Celebrity, Metonymy, and the Networked Politics of Identity 400
Visceral obesity is associated with clinical and inflammatory features of asthma: A prospective cohort study 300
Getting Published in SSCI Journals: 200+ Questions and Answers for Absolute Beginners 300
Engineering the boosting of the magnetic Purcell factor with a composite structure based on nanodisk and ring resonators 240
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3838497
求助须知:如何正确求助?哪些是违规求助? 3380808
关于积分的说明 10515927
捐赠科研通 3100415
什么是DOI,文献DOI怎么找? 1707492
邀请新用户注册赠送积分活动 821774
科研通“疑难数据库(出版商)”最低求助积分说明 772947