亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Adaptive Optimal Tracking Control of an Underactuated Surface Vessel Using Actor–Critic Reinforcement Learning

强化学习 无人机 欠驱动 计算机科学 跟踪(教育) 钢筋 曲面(拓扑) 控制(管理) 数学 人工智能 工程类 海洋工程 心理学 结构工程 几何学 教育学
作者
Lin Chen,Shi‐Lu Dai,Chao Dong
出处
期刊:IEEE transactions on neural networks and learning systems [Institute of Electrical and Electronics Engineers]
卷期号:35 (6): 7520-7533 被引量:53
标识
DOI:10.1109/tnnls.2022.3214681
摘要

In this article, we present an adaptive reinforcement learning optimal tracking control (RLOTC) algorithm for an underactuated surface vessel subject to modeling uncertainties and time-varying external disturbances. By integrating backstepping technique with the optimized control design, we show that the desired optimal tracking performance of vessel control is guaranteed due to the fact that the virtual and actual control inputs are designed as optimized solutions of every subsystem. To enhance the robustness of vessel control systems, we employ neural network (NN) approximators to approximate uncertain vessel dynamics and present adaptive control technique to estimate the upper boundedness of external disturbances. Under the reinforcement learning framework, we construct actor–critic networks to solve the Hamilton–Jacobi–Bellman equations corresponding to subsystems of surface vessel to achieve the optimized control. The optimized control algorithm can synchronously train the adaptive parameters not only for actor–critic networks but also for NN approximators and adaptive control. By Lyapunov stability theorem, we show that the RLOTC algorithm can ensure the semiglobal uniform ultimate boundedness of the closed-loop systems. Compared with the existing reinforcement learning control results, the presented RLOTC algorithm can compensate for uncertain vessel dynamics and unknown disturbances, and obtain the optimized control performance by considering optimization in every backstepping design. Simulation studies on an underactuated surface vessel are given to illustrate the effectiveness of the RLOTC algorithm.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
clean完成签到,获得积分10
18秒前
斯文麦片完成签到 ,获得积分10
33秒前
科研通AI6.2应助阳佟人达采纳,获得10
59秒前
青云完成签到,获得积分10
1分钟前
1分钟前
橙橙完成签到,获得积分10
1分钟前
深情安青应助糟糕的如音采纳,获得10
1分钟前
1分钟前
1分钟前
烨枫晨曦完成签到,获得积分10
2分钟前
科研通AI6.2应助何首乌采纳,获得10
2分钟前
2分钟前
何首乌发布了新的文献求助10
3分钟前
乐乐应助轻松蘑菇采纳,获得10
3分钟前
Cristina2024完成签到,获得积分10
3分钟前
3分钟前
轻松蘑菇发布了新的文献求助10
3分钟前
何首乌完成签到,获得积分20
3分钟前
yh完成签到,获得积分10
3分钟前
俊秀的思烟应助轻松蘑菇采纳,获得10
4分钟前
chem完成签到,获得积分10
4分钟前
轻松蘑菇完成签到,获得积分10
4分钟前
泡泡完成签到 ,获得积分10
4分钟前
4分钟前
zimi发布了新的文献求助10
4分钟前
田様应助Shmilykk采纳,获得10
4分钟前
英姑应助tfop采纳,获得10
4分钟前
4分钟前
Shmilykk发布了新的文献求助10
4分钟前
4分钟前
tfop发布了新的文献求助10
5分钟前
852应助Shmilykk采纳,获得10
5分钟前
5分钟前
Shmilykk发布了新的文献求助10
5分钟前
阿瓜师傅完成签到 ,获得积分10
5分钟前
Shmilykk完成签到,获得积分10
5分钟前
科研通AI6.3应助何首乌采纳,获得10
5分钟前
快乐傲南完成签到,获得积分10
6分钟前
Augustines完成签到,获得积分10
6分钟前
威武的晋鹏完成签到,获得积分10
6分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Salmon nasal cartilage-derived proteoglycan complexes influence the gut microbiota and bacterial metabolites in mice 2000
The Composition and Relative Chronology of Dynasties 16 and 17 in Egypt 1500
Picture this! Including first nations fiction picture books in school library collections 1500
SMITHS Ti-6Al-2Sn-4Zr-2Mo-Si: Ti-6Al-2Sn-4Zr-2Mo-Si Alloy 850
Signals, Systems, and Signal Processing 610
Learning manta ray foraging optimisation based on external force for parameters identification of photovoltaic cell and module 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6376298
求助须知:如何正确求助?哪些是违规求助? 8189603
关于积分的说明 17294499
捐赠科研通 5430207
什么是DOI,文献DOI怎么找? 2872889
邀请新用户注册赠送积分活动 1849458
关于科研通互助平台的介绍 1694994