Optimized Backstepping Combined With Dynamic Surface Technique for Single-Input–Single-Output Nonlinear Strict-Feedback System

反推 控制理论(社会学) 非线性系统 汉密尔顿-雅各比-贝尔曼方程 计算机科学 强化学习 控制(管理) 数学优化 非线性控制 曲面(拓扑) 数学 最优控制 自适应控制 人工智能 物理 几何学 量子力学
作者
Guoxing Wen,Ranran Zhou,Yanlong Zhao,Ben Niu
出处
期刊:IEEE transactions on systems, man, and cybernetics [Institute of Electrical and Electronics Engineers]
卷期号:54 (7): 4210-4221 被引量:11
标识
DOI:10.1109/tsmc.2024.3379356
摘要

In this article, for the single-input–single-output (SISO) nonlinear strict-feedback system, optimized backstepping (OB) control combined with the dynamic surface (DS) technique is developed. OB is to make every subsystem control of backstepping as the optimized one so as to ensure the entire backstepping control being optimized. However, the original design of OB still needs to repeatedly calculate the derivative of virtual controls, as a result, it will inevitably cause the problem of "differential explosion." In order to alleviate the phenomenon, the OB control is combined with the DS technique. Furthermore, OB control needs to conduct with reinforcement learning (RL) in every backstepping step, hence simplifying the algorithm of RL is very necessary and substantive for achieving the combination. In this work, because the optimized control derives both critic and actor training laws by utilizing a simple positive function instead of the square of approximation of Hamilton–Jacobi–Bellman (HJB) equation, it can obviously simplify the RL algorithm to compare with the traditional optimizing methods. Finally, the feasibility is illustrated via both theory and simulation.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
刚刚
刚刚
今夜不设防完成签到,获得积分10
刚刚
PetrichorF完成签到 ,获得积分10
刚刚
光喵发布了新的文献求助10
刚刚
yrr完成签到 ,获得积分10
刚刚
1秒前
洁净思枫发布了新的文献求助10
1秒前
Mona发布了新的文献求助10
1秒前
1秒前
2秒前
斯文的龙猫完成签到,获得积分10
2秒前
3秒前
OsamaKareem应助Dylan采纳,获得10
3秒前
JoJoT完成签到,获得积分20
3秒前
情怀应助迷路手机采纳,获得10
3秒前
3秒前
SciGPT应助星空采纳,获得10
4秒前
慧hui发布了新的文献求助10
4秒前
123发布了新的文献求助10
4秒前
生动的雨旋发布了新的文献求助100
5秒前
5秒前
5秒前
5秒前
Folium发布了新的文献求助10
5秒前
爆米花应助风中冰蝶采纳,获得10
5秒前
6秒前
6秒前
6秒前
6秒前
科研通AI6.4应助光喵采纳,获得10
6秒前
AURORA发布了新的文献求助10
6秒前
7秒前
李创业发布了新的文献求助10
7秒前
豆4799完成签到,获得积分10
7秒前
amorfati完成签到,获得积分10
7秒前
CipherSage应助xjx采纳,获得10
7秒前
Zerosiii完成签到,获得积分10
7秒前
8秒前
高分求助中
Overcoming Stigma and Bias in Obesity Management 800
Malcolm Fraser : a biography 700
Signals, Systems, and Signal Processing 610
Materials selection in mechanical design 500
Bounds for Statistical Estimation in Semiparametric Models 500
Climate change and sports: Statistics report on climate change and sports 500
Forced degradation and stability indicating LC method for Letrozole: A stress testing guide 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6478537
求助须知:如何正确求助?哪些是违规求助? 8279987
关于积分的说明 17659491
捐赠科研通 5560908
什么是DOI,文献DOI怎么找? 2911103
邀请新用户注册赠送积分活动 1888090
关于科研通互助平台的介绍 1741942