A mean field view of the landscape of two-layer neural networks

最大值和最小值 人工神经网络 一般化 随机梯度下降算法 极限(数学) 趋同(经济学) 计算机科学 梯度下降 非线性系统 功能(生物学) 数学优化 应用数学 领域(数学) 数学 人工智能 物理 纯数学 数学分析 量子力学 进化生物学 经济 生物 经济增长
作者
Mei Song,Andrea Montanari,Phan-Minh Nguyen
出处
期刊:Proceedings of the National Academy of Sciences of the United States of America [National Academy of Sciences]
卷期号:115 (33) 被引量:471
标识
DOI:10.1073/pnas.1806579115
摘要

Multilayer neural networks are among the most powerful models in machine learning, yet the fundamental reasons for this success defy mathematical understanding. Learning a neural network requires optimizing a nonconvex high-dimensional objective (risk function), a problem that is usually attacked using stochastic gradient descent (SGD). Does SGD converge to a global optimum of the risk or only to a local optimum? In the former case, does this happen because local minima are absent or because SGD somehow avoids them? In the latter, why do local minima reached by SGD have good generalization properties? In this paper, we consider a simple case, namely two-layer neural networks, and prove that-in a suitable scaling limit-SGD dynamics is captured by a certain nonlinear partial differential equation (PDE) that we call distributional dynamics (DD). We then consider several specific examples and show how DD can be used to prove convergence of SGD to networks with nearly ideal generalization error. This description allows for "averaging out" some of the complexities of the landscape of neural networks and can be used to prove a general convergence result for noisy SGD.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
乐乐应助梁正强采纳,获得10
1秒前
番茄鸡蛋仔完成签到 ,获得积分10
1秒前
项彼夜完成签到,获得积分10
1秒前
4秒前
冷静剑成完成签到,获得积分10
5秒前
LioXH发布了新的文献求助10
5秒前
6秒前
aki完成签到 ,获得积分10
6秒前
6秒前
7秒前
黄卡卡完成签到,获得积分10
9秒前
10秒前
默存完成签到,获得积分0
10秒前
流苏完成签到,获得积分10
10秒前
共享精神应助天真大神采纳,获得10
10秒前
梁正强发布了新的文献求助10
11秒前
毛毛发布了新的文献求助10
11秒前
嗯qq发布了新的文献求助10
11秒前
12秒前
14秒前
专注向真完成签到,获得积分10
14秒前
anna1992完成签到,获得积分10
14秒前
赵田完成签到 ,获得积分10
16秒前
TYQ完成签到,获得积分10
16秒前
天真大神完成签到,获得积分20
16秒前
16秒前
anna1992发布了新的文献求助10
17秒前
锦上完成签到,获得积分10
18秒前
yuko完成签到 ,获得积分10
18秒前
LXL发布了新的文献求助10
19秒前
高贵煎蛋完成签到,获得积分10
19秒前
Limo发布了新的文献求助10
20秒前
无心的寄灵完成签到,获得积分10
21秒前
橘子完成签到,获得积分10
21秒前
zhuboujs完成签到,获得积分10
21秒前
领导范儿应助马天毅采纳,获得10
21秒前
传奇3应助蓝天采纳,获得10
22秒前
Yue_David完成签到,获得积分10
22秒前
张欢馨完成签到,获得积分0
23秒前
23秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
A Research Agenda for Law, Finance and the Environment 800
Development Across Adulthood 800
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
A Time to Mourn, A Time to Dance: The Expression of Grief and Joy in Israelite Religion 700
The formation of Australian attitudes towards China, 1918-1941 640
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6446240
求助须知:如何正确求助?哪些是违规求助? 8259584
关于积分的说明 17595982
捐赠科研通 5507214
什么是DOI,文献DOI怎么找? 2901952
邀请新用户注册赠送积分活动 1879018
关于科研通互助平台的介绍 1719148