A control theoretic framework for adaptive gradient optimizers

计算机科学 收敛速度 水准点(测量) 趋同(经济学) 自适应控制 数学优化 人工智能 数学证明 数学 控制(管理) 钥匙(锁) 大地测量学 经济增长 经济 地理 几何学 计算机安全
作者
Kushal Chakrabarti,Nikhil Chopra
出处
期刊:Automatica [Elsevier]
卷期号:160: 111466-111466
标识
DOI:10.1016/j.automatica.2023.111466
摘要

Gradient-based optimization and control frameworks have been utilized in several applications. The learning rate parameter is typically chosen following a schedule or using methods such as line search to enhance the convergence rate. Recently, the machine learning community has developed methodologies for automated tuning of the learning rate, known as adaptive gradient methods. This paper develops a control theory-inspired framework for modeling adaptive gradient methods that solve non-convex optimization problems. We first model the adaptive gradient methods in a state–space framework, which allows us to present simpler convergence proofs of prominent adaptive optimizers, such as AdaGrad, Adam, and AdaBelief. The proposed framework is constructive because it allows synthesizing new adaptive optimizers. To illustrate this fact, we then utilize the transfer function paradigm from classical control to propose a new variant of Adam, coined AdamSSM, and prove its convergence. We add an appropriate pole-zero pair in the transfer function from squared gradients to the second moment estimate. Applications on benchmark machine learning tasks of image classification using CNN architectures and language modeling using LSTM architecture demonstrate that the AdamSSM algorithm improves the gap between generalization accuracy and faster convergence than the recent adaptive gradient methods.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
酷酷宛筠应助甜甜问儿采纳,获得10
1秒前
3秒前
张雨发布了新的文献求助30
5秒前
爱科研的绿巨人完成签到,获得积分10
7秒前
王冬瓜发布了新的文献求助10
8秒前
泡泡虾发布了新的文献求助10
8秒前
10秒前
10秒前
lyfffffff关注了科研通微信公众号
12秒前
李洪卓发布了新的文献求助20
13秒前
滴滴嘟发布了新的文献求助10
15秒前
16秒前
怡然小凝发布了新的文献求助10
20秒前
领导范儿应助怡然小凝采纳,获得10
32秒前
自然忻完成签到 ,获得积分10
38秒前
39秒前
我本楚狂人完成签到,获得积分10
40秒前
自然忻关注了科研通微信公众号
42秒前
七七发布了新的文献求助10
43秒前
hahaha完成签到,获得积分10
45秒前
虚幻的跳跳糖完成签到 ,获得积分10
46秒前
shinysparrow应助科研通管家采纳,获得10
47秒前
shinysparrow应助科研通管家采纳,获得10
47秒前
科目三应助科研通管家采纳,获得10
47秒前
tuanheqi应助科研通管家采纳,获得50
47秒前
wanci应助科研通管家采纳,获得10
47秒前
shinysparrow应助科研通管家采纳,获得10
47秒前
shinysparrow应助科研通管家采纳,获得10
47秒前
YIBO发布了新的文献求助10
49秒前
fiberlaser发布了新的文献求助10
58秒前
58秒前
xxh完成签到,获得积分10
1分钟前
葛三完成签到 ,获得积分10
1分钟前
骡子发布了新的文献求助10
1分钟前
扬大小汤发布了新的文献求助10
1分钟前
文献查找发布了新的文献求助10
1分钟前
凡人丿完成签到 ,获得积分10
1分钟前
露卡完成签到,获得积分10
1分钟前
lihaifeng发布了新的文献求助10
1分钟前
高分求助中
请在求助之前详细阅读求助说明!!!! 20000
Sphäroguß als Werkstoff für Behälter zur Beförderung, Zwischen- und Endlagerung radioaktiver Stoffe - Untersuchung zu alternativen Eignungsnachweisen: Zusammenfassender Abschlußbericht 1500
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 1000
Yuwu Song, Biographical Dictionary of the People's Republic of China 700
[Lambert-Eaton syndrome without calcium channel autoantibodies] 520
The Three Stars Each: The Astrolabes and Related Texts 500
india-NATO Dialogue: Addressing International Security and Regional Challenges 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2469799
求助须知:如何正确求助?哪些是违规求助? 2136971
关于积分的说明 5444880
捐赠科研通 1861323
什么是DOI,文献DOI怎么找? 925714
版权声明 562721
科研通“疑难数据库(出版商)”最低求助积分说明 495151