Parallel Optimal Tracking Control Schemes for Mode-Dependent Control of Coupled Markov Jump Systems via Integral RL Method

控制理论(社会学) 代数Riccati方程 计算机科学 趋同(经济学) 最优控制 马尔可夫链 跟踪(教育) 李雅普诺夫函数 强化学习 马尔可夫过程 控制(管理) 数学优化 数学 Riccati方程 微分方程 非线性系统 人工智能 物理 心理学 经济 数学分析 机器学习 统计 教育学 量子力学 经济增长
作者
Kun Zhang,Huaguang Zhang,Yuliang Cai,Rong Su
出处
期刊:IEEE Transactions on Automation Science and Engineering [Institute of Electrical and Electronics Engineers]
卷期号:: 1-11 被引量:48
标识
DOI:10.1109/tase.2019.2948431
摘要

This article is concerned with the optimal tracking control problem of the coupled Markov jump system (CMJS) by using the reinforcement learning (RL) technique. Based on the conventional optimal tracking architecture, an offline tracking iteration algorithm is first designed to solve the coupled algebraic Riccati equation that can hardly be solved by mathematical methods directly. To overcome the crucial requirements and existing shortcomings in the offline tracking method, a novel integral RL (IRL) tracking algorithm is first proposed for CMJS, which develops a transition-probability-free optimal tracking control scheme with a reconstructed augmented system and discounted cost function. Both the requirements of transition probability πij and system matrix Ai are avoided via the designed IRL algorithm. The stability and convergence of the novel schemes are proved by the Lyapunov theory, and the tracking objective is achieved as desired. Finally, we apply the designed algorithms in a fourth-order Markov jump control problem and the stochastic mass, spring, and damper system to track continuous sinusoidal waveforms, and the simulation results are provided to show the effectiveness and applicability.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
2秒前
同玉发布了新的文献求助10
3秒前
难过盼海发布了新的文献求助10
5秒前
汉堡包应助如是之人采纳,获得10
8秒前
NexusExplorer应助kk采纳,获得30
9秒前
汤飞柏发布了新的文献求助10
9秒前
刀客特幽完成签到,获得积分0
10秒前
重要的哈密瓜完成签到 ,获得积分10
11秒前
大模型应助Jenny采纳,获得20
13秒前
14秒前
舒心靖琪完成签到,获得积分10
14秒前
14秒前
丸子完成签到,获得积分10
14秒前
Owen应助bqf采纳,获得10
15秒前
如是之人完成签到,获得积分10
15秒前
我不会乱起名字的完成签到,获得积分10
16秒前
19秒前
19秒前
19秒前
独特秋凌完成签到 ,获得积分10
20秒前
21秒前
kk发布了新的文献求助30
22秒前
成就映秋完成签到,获得积分10
24秒前
领导范儿应助LYHZAU采纳,获得10
24秒前
wangdong完成签到,获得积分0
26秒前
27秒前
氙气飘飘完成签到 ,获得积分10
29秒前
bqf完成签到,获得积分20
29秒前
29秒前
pu完成签到 ,获得积分10
30秒前
大泥鳅发布了新的文献求助10
32秒前
bqf发布了新的文献求助10
33秒前
完美世界应助kk采纳,获得10
34秒前
单纯的冬灵完成签到 ,获得积分10
35秒前
勤奋的白桃完成签到,获得积分10
36秒前
乐乐应助jiangyao采纳,获得10
37秒前
大泥鳅完成签到,获得积分20
38秒前
39秒前
大模型应助Brave采纳,获得10
39秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Technologies supporting mass customization of apparel: A pilot project 450
Mixing the elements of mass customisation 360
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
the MD Anderson Surgical Oncology Manual, Seventh Edition 300
Nucleophilic substitution in azasydnone-modified dinitroanisoles 300
Political Ideologies Their Origins and Impact 13th Edition 260
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3781649
求助须知:如何正确求助?哪些是违规求助? 3327217
关于积分的说明 10230067
捐赠科研通 3042074
什么是DOI,文献DOI怎么找? 1669791
邀请新用户注册赠送积分活动 799315
科研通“疑难数据库(出版商)”最低求助积分说明 758774