Control Lyapunov‐barrier function‐based safe reinforcement learning for nonlinear optimal control

强化学习 李雅普诺夫函数 控制理论(社会学) 贝尔曼方程 控制Lyapunov函数 理论(学习稳定性) 功能(生物学) 过程(计算) 非线性系统 计算机科学 人工神经网络 最优控制 数学优化 Lyapunov重新设计 控制(管理) 数学 人工智能 机器学习 物理 量子力学 进化生物学 生物 操作系统
作者
Yujia Wang,Zhe Wu
出处
期刊:Aiche Journal [Wiley]
卷期号:70 (3)
标识
DOI:10.1002/aic.18306
摘要

Abstract This article develops a safe reinforcement learning (SRL) algorithm for optimal control of nonlinear systems with input constraints. First, we design a novel performance index function by taking advantage of control Lyapunov‐barrier functions (CLBF) with inherent safety and stability properties to ensure closed‐loop stability and safety during operation under the optimal control policy. Additionally, since it is challenging to represent the CLBF‐based value function as an explicit function of process states, neural networks (NNs) are used to approximate the value function using the process operational data that indicate safe and unsafe operations. Theoretical results on the stability, safety, and optimality of the SRL algorithm are developed, accounting for the approximation error of the NN‐based value function. Finally, the efficacy of the proposed safe optimal control scheme is shown using an application to a chemical process example.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
fangzh完成签到,获得积分10
1秒前
1秒前
2秒前
李多意完成签到,获得积分10
2秒前
2秒前
2秒前
小香菜完成签到,获得积分10
2秒前
SWD发布了新的文献求助10
3秒前
4秒前
123稻稻人完成签到,获得积分10
4秒前
没休息好完成签到,获得积分10
4秒前
快乐的天奇完成签到,获得积分20
5秒前
微风发布了新的文献求助10
6秒前
小蘑菇应助遇见0608采纳,获得10
6秒前
6秒前
张雨发布了新的文献求助30
7秒前
7秒前
李老头发布了新的文献求助10
7秒前
在水一方应助小胡工科崽采纳,获得10
7秒前
哈哈哈哈哈哈完成签到,获得积分10
9秒前
9秒前
10秒前
10秒前
10秒前
cheng发布了新的文献求助10
10秒前
微风完成签到,获得积分10
10秒前
11秒前
11秒前
希望天下0贩的0应助camellia采纳,获得10
11秒前
斯文败类应助小盛采纳,获得10
12秒前
feimengxia发布了新的文献求助10
12秒前
mg发布了新的文献求助10
13秒前
14秒前
陶醉听芹发布了新的文献求助10
14秒前
我爱科研发布了新的文献求助10
14秒前
初见完成签到 ,获得积分10
14秒前
15秒前
贪玩的沛槐完成签到,获得积分10
15秒前
研友_Ljqal8完成签到,获得积分10
15秒前
高分求助中
【本贴是提醒信息,请勿应助】请在求助之前详细阅读求助说明!!!! 20000
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 1000
The Three Stars Each: The Astrolabes and Related Texts 900
Yuwu Song, Biographical Dictionary of the People's Republic of China 800
Multifunctional Agriculture, A New Paradigm for European Agriculture and Rural Development 600
Challenges, Strategies, and Resiliency in Disaster and Risk Management 500
Bernd Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2481326
求助须知:如何正确求助?哪些是违规求助? 2144104
关于积分的说明 5468299
捐赠科研通 1866532
什么是DOI,文献DOI怎么找? 927659
版权声明 563032
科研通“疑难数据库(出版商)”最低求助积分说明 496371