Parallel Optimal Tracking Control Schemes for Mode-Dependent Control of Coupled Markov Jump Systems via Integral RL Method

控制理论(社会学) 代数Riccati方程 计算机科学 趋同(经济学) 最优控制 马尔可夫链 跟踪(教育) 李雅普诺夫函数 强化学习 马尔可夫过程 控制(管理) 数学优化 数学 Riccati方程 微分方程 非线性系统 人工智能 物理 心理学 经济 数学分析 机器学习 统计 教育学 量子力学 经济增长
作者
Kun Zhang,Huaguang Zhang,Yuliang Cai,Rong Su
出处
期刊:IEEE Transactions on Automation Science and Engineering [Institute of Electrical and Electronics Engineers]
卷期号:: 1-11 被引量:48
标识
DOI:10.1109/tase.2019.2948431
摘要

This article is concerned with the optimal tracking control problem of the coupled Markov jump system (CMJS) by using the reinforcement learning (RL) technique. Based on the conventional optimal tracking architecture, an offline tracking iteration algorithm is first designed to solve the coupled algebraic Riccati equation that can hardly be solved by mathematical methods directly. To overcome the crucial requirements and existing shortcomings in the offline tracking method, a novel integral RL (IRL) tracking algorithm is first proposed for CMJS, which develops a transition-probability-free optimal tracking control scheme with a reconstructed augmented system and discounted cost function. Both the requirements of transition probability πij and system matrix Ai are avoided via the designed IRL algorithm. The stability and convergence of the novel schemes are proved by the Lyapunov theory, and the tracking objective is achieved as desired. Finally, we apply the designed algorithms in a fourth-order Markov jump control problem and the stochastic mass, spring, and damper system to track continuous sinusoidal waveforms, and the simulation results are provided to show the effectiveness and applicability.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
flyta发布了新的文献求助10
刚刚
忧虑的远锋完成签到,获得积分10
刚刚
烟花应助Dream采纳,获得10
1秒前
yyyyy发布了新的文献求助10
1秒前
bkagyin应助开心叫兽采纳,获得10
1秒前
lili完成签到,获得积分10
1秒前
1秒前
weihuiting2024完成签到,获得积分10
2秒前
2秒前
alin应助spz采纳,获得10
3秒前
3秒前
jun发布了新的文献求助10
4秒前
4秒前
7秒前
共享精神应助honor179采纳,获得10
7秒前
9秒前
852应助Yong采纳,获得10
9秒前
直率海莲完成签到 ,获得积分10
10秒前
zp560应助Kyle采纳,获得100
10秒前
11秒前
willing完成签到,获得积分10
11秒前
agi发布了新的文献求助10
11秒前
12秒前
lzx发布了新的文献求助10
12秒前
yyyyy完成签到,获得积分20
13秒前
学习发布了新的文献求助10
13秒前
Fan完成签到,获得积分10
13秒前
Leo_Sun发布了新的文献求助20
13秒前
lin完成签到,获得积分10
14秒前
14秒前
外向飞凤发布了新的文献求助10
15秒前
小猪猪发布了新的文献求助10
16秒前
16秒前
17秒前
可爱的函函应助孙瞳采纳,获得10
17秒前
呋喃发布了新的文献求助10
19秒前
爆米花应助谨慎的大门采纳,获得10
20秒前
CipherSage应助谨慎的大门采纳,获得10
20秒前
Jasper应助南瓜汤放点盐采纳,获得10
20秒前
云朵发布了新的文献求助10
22秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Cowries - A Guide to the Gastropod Family Cypraeidae 1200
Quality by Design - An Indispensable Approach to Accelerate Biopharmaceutical Product Development 800
Pulse width control of a 3-phase inverter with non sinusoidal phase voltages 777
Signals, Systems, and Signal Processing 610
A Social and Cultural History of the Hellenistic World 500
Chemistry and Physics of Carbon Volume 15 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6398486
求助须知:如何正确求助?哪些是违规求助? 8213748
关于积分的说明 17405499
捐赠科研通 5451834
什么是DOI,文献DOI怎么找? 2881535
邀请新用户注册赠送积分活动 1858013
关于科研通互助平台的介绍 1699993