Control Lyapunov‐barrier function‐based safe reinforcement learning for nonlinear optimal control

强化学习 李雅普诺夫函数 控制理论(社会学) 贝尔曼方程 控制Lyapunov函数 理论(学习稳定性) 功能(生物学) 过程(计算) 非线性系统 计算机科学 人工神经网络 最优控制 数学优化 Lyapunov重新设计 控制(管理) 数学 人工智能 机器学习 物理 量子力学 进化生物学 生物 操作系统
作者
Yujia Wang,Zhe Wu
出处
期刊:Aiche Journal [Wiley]
卷期号:70 (3)
标识
DOI:10.1002/aic.18306
摘要

Abstract This article develops a safe reinforcement learning (SRL) algorithm for optimal control of nonlinear systems with input constraints. First, we design a novel performance index function by taking advantage of control Lyapunov‐barrier functions (CLBF) with inherent safety and stability properties to ensure closed‐loop stability and safety during operation under the optimal control policy. Additionally, since it is challenging to represent the CLBF‐based value function as an explicit function of process states, neural networks (NNs) are used to approximate the value function using the process operational data that indicate safe and unsafe operations. Theoretical results on the stability, safety, and optimality of the SRL algorithm are developed, accounting for the approximation error of the NN‐based value function. Finally, the efficacy of the proposed safe optimal control scheme is shown using an application to a chemical process example.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
王思鲁发布了新的文献求助30
1秒前
1秒前
土豆淀粉发布了新的文献求助10
3秒前
xiao发布了新的文献求助10
4秒前
5秒前
6秒前
北风应助qiqi采纳,获得10
7秒前
8秒前
北风应助JxJ采纳,获得10
8秒前
泡面加蛋发布了新的文献求助10
10秒前
科研通AI5应助科研通管家采纳,获得10
10秒前
星辰大海应助科研通管家采纳,获得10
11秒前
小罗完成签到 ,获得积分10
11秒前
xingxinghan完成签到 ,获得积分10
11秒前
典雅葶完成签到 ,获得积分10
11秒前
11秒前
11秒前
12秒前
12秒前
12秒前
天天快乐应助BPX采纳,获得10
13秒前
13秒前
123发布了新的文献求助10
14秒前
15秒前
15秒前
动听半雪发布了新的文献求助10
16秒前
fdwonder完成签到,获得积分10
16秒前
sc发布了新的文献求助10
17秒前
木火应助渔舟漫星河采纳,获得20
17秒前
123完成签到,获得积分10
20秒前
20秒前
20秒前
苻涵菡完成签到,获得积分10
21秒前
清颜发布了新的文献求助10
22秒前
雷德露丝完成签到,获得积分10
23秒前
涂楚捷发布了新的文献求助10
23秒前
英姑应助sc采纳,获得10
24秒前
wanci应助li2000722采纳,获得10
24秒前
24秒前
25秒前
高分求助中
Les Mantodea de Guyane Insecta, Polyneoptera 2500
Nucleophilic substitution in azasydnone-modified dinitroanisoles 500
Technologies supporting mass customization of apparel: A pilot project 450
Brain and Heart The Triumphs and Struggles of a Pediatric Neurosurgeon 400
Cybersecurity Blueprint – Transitioning to Tech 400
Mixing the elements of mass customisation 400
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3783663
求助须知:如何正确求助?哪些是违规求助? 3328848
关于积分的说明 10238905
捐赠科研通 3044253
什么是DOI,文献DOI怎么找? 1670861
邀请新用户注册赠送积分活动 799939
科研通“疑难数据库(出版商)”最低求助积分说明 759171