清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Neural Tangent Kernel: Convergence and Generalization in Neural Networks

数学 核(代数) 人工神经网络 梯度下降 初始化 应用数学 变核密度估计 核方法 极限(数学) 过度拟合 数学分析 计算机科学 人工智能 组合数学 支持向量机 程序设计语言
作者
Arthur Paul Jacot,Franck Gabriel,Clément Hongler
出处
期刊:Cornell University - arXiv 被引量:1460
标识
DOI:10.48550/arxiv.1806.07572
摘要

At initialization, artificial neural networks (ANNs) are equivalent to Gaussian processes in the infinite-width limit, thus connecting them to kernel methods. We prove that the evolution of an ANN during training can also be described by a kernel: during gradient descent on the parameters of an ANN, the network function $f_\theta$ (which maps input vectors to output vectors) follows the kernel gradient of the functional cost (which is convex, in contrast to the parameter cost) w.r.t. a new kernel: the Neural Tangent Kernel (NTK). This kernel is central to describe the generalization features of ANNs. While the NTK is random at initialization and varies during training, in the infinite-width limit it converges to an explicit limiting kernel and it stays constant during training. This makes it possible to study the training of ANNs in function space instead of parameter space. Convergence of the training can then be related to the positive-definiteness of the limiting NTK. We prove the positive-definiteness of the limiting NTK when the data is supported on the sphere and the non-linearity is non-polynomial. We then focus on the setting of least-squares regression and show that in the infinite-width limit, the network function $f_\theta$ follows a linear differential equation during training. The convergence is fastest along the largest kernel principal components of the input data with respect to the NTK, hence suggesting a theoretical motivation for early stopping. Finally we study the NTK numerically, observe its behavior for wide networks, and compare it to the infinite-width limit.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
星辰大海应助葛力采纳,获得10
51秒前
lilaccalla完成签到 ,获得积分10
1分钟前
1分钟前
ma发布了新的文献求助10
1分钟前
1分钟前
dylanqy发布了新的文献求助30
2分钟前
2分钟前
优雅山柏发布了新的文献求助10
2分钟前
2分钟前
zoe完成签到 ,获得积分10
3分钟前
王_123123123123w完成签到 ,获得积分10
3分钟前
dylanqy完成签到,获得积分10
3分钟前
huangzsdy完成签到,获得积分10
3分钟前
ChiHiRo9Q完成签到,获得积分10
3分钟前
baroque完成签到 ,获得积分10
4分钟前
研友_VZG7GZ应助苔藓采纳,获得10
4分钟前
4分钟前
苔藓发布了新的文献求助10
4分钟前
科研通AI5应助ma采纳,获得10
5分钟前
5分钟前
科研通AI2S应助科研通管家采纳,获得10
5分钟前
斯文败类应助科研通管家采纳,获得10
5分钟前
ma发布了新的文献求助10
5分钟前
123完成签到 ,获得积分10
5分钟前
慕青应助百里采纳,获得10
5分钟前
冷傲半邪完成签到,获得积分10
5分钟前
5分钟前
6分钟前
葛力发布了新的文献求助10
6分钟前
百里发布了新的文献求助10
6分钟前
方白秋完成签到,获得积分10
6分钟前
科研通AI2S应助葛力采纳,获得10
6分钟前
naczx完成签到,获得积分0
6分钟前
6分钟前
vitamin完成签到 ,获得积分10
6分钟前
紫熊完成签到,获得积分10
6分钟前
直率的笑翠完成签到 ,获得积分10
7分钟前
吕半鬼完成签到,获得积分0
7分钟前
一见憘完成签到 ,获得积分10
7分钟前
知行者完成签到 ,获得积分10
7分钟前
高分求助中
Applied Survey Data Analysis (第三版, 2025) 800
Assessing and Diagnosing Young Children with Neurodevelopmental Disorders (2nd Edition) 700
Images that translate 500
引进保护装置的分析评价八七年国外进口线路等保护运行情况介绍 500
Algorithmic Mathematics in Machine Learning 500
Handbook of Innovations in Political Psychology 400
Mapping the Stars: Celebrity, Metonymy, and the Networked Politics of Identity 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3840848
求助须知:如何正确求助?哪些是违规求助? 3382744
关于积分的说明 10526431
捐赠科研通 3102602
什么是DOI,文献DOI怎么找? 1708918
邀请新用户注册赠送积分活动 822781
科研通“疑难数据库(出版商)”最低求助积分说明 773603