FuzzyH∞Control of Discrete-Time Nonlinear Markov Jump Systems via a Novel Hybrid ReinforcementQ-Learning Method

强化学习 马尔可夫决策过程 增强学习 计算机科学 模糊控制系统 控制理论(社会学) 趋同(经济学) 数学优化 模糊逻辑 离散时间和连续时间 非线性系统 控制器(灌溉) 数学 马尔可夫过程 控制(管理) 人工智能 量子力学 生物 统计 经济增长 物理 经济 农学
作者
Jing Wang,Jiacheng Wu,Hao Shen,Jinde Cao,Leszek Rutkowski
出处
期刊:IEEE transactions on cybernetics [Institute of Electrical and Electronics Engineers]
卷期号:53 (11): 7380-7391 被引量:52
标识
DOI:10.1109/tcyb.2022.3220537
摘要

In this article, a novel hybrid reinforcement Q -learning control method is proposed to solve the adaptive fuzzy H∞ control problem of discrete-time nonlinear Markov jump systems based on the Takagi-Sugeno fuzzy model. First, the core problem of adaptive fuzzy H∞ control is converted to solving fuzzy game coupled algebraic Riccati equation, which can hardly be solved by mathematical methods directly. To solve this problem, an offline parallel hybrid learning algorithm is first designed, where system dynamics should be known as a prior. Furthermore, an online parallel Q -learning hybrid learning algorithm is developed. The main characteristics of the proposed online hybrid learning algorithms are threefold: 1) system dynamics are avoided during the learning process; 2) compared with the policy iteration method, the restriction of the initial stable control policy is removed; and 3) compared with the value iteration method, a faster convergence rate can be obtained. Finally, we provide a tunnel diode circuit system model to validate the effectiveness of the present learning algorithm.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
翊然甜周完成签到,获得积分10
1秒前
2秒前
panpan发布了新的文献求助10
3秒前
菜菜Cc发布了新的文献求助10
3秒前
李倇仪完成签到,获得积分10
3秒前
陈辉完成签到,获得积分10
3秒前
4秒前
wangchen发布了新的文献求助10
4秒前
hhj02完成签到,获得积分10
4秒前
飘逸宛丝完成签到,获得积分10
7秒前
w32发布了新的文献求助10
8秒前
moca发布了新的文献求助10
8秒前
12秒前
木子完成签到 ,获得积分10
15秒前
15秒前
小橙子完成签到 ,获得积分10
15秒前
zhangruiii完成签到,获得积分10
17秒前
6633发布了新的文献求助10
17秒前
爆米花应助小白采纳,获得10
18秒前
梦若浮生完成签到 ,获得积分10
18秒前
18秒前
研友_8Y2M0L发布了新的文献求助10
19秒前
panpan完成签到 ,获得积分20
20秒前
moca完成签到,获得积分10
21秒前
Rhythm完成签到 ,获得积分10
22秒前
慕青应助君齐采纳,获得10
22秒前
lvsehx发布了新的文献求助10
23秒前
zho发布了新的文献求助10
27秒前
向言之完成签到,获得积分10
28秒前
29秒前
李健的小迷弟应助6633采纳,获得10
30秒前
满意涵梅完成签到 ,获得积分10
32秒前
会笑的花发布了新的文献求助10
33秒前
呃呃发布了新的文献求助30
33秒前
逆蝶完成签到,获得积分10
33秒前
Orange应助杜11采纳,获得10
33秒前
CodeCraft应助任性的天空采纳,获得10
34秒前
orixero应助qqy采纳,获得10
35秒前
999完成签到,获得积分10
36秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Technologies supporting mass customization of apparel: A pilot project 450
Mixing the elements of mass customisation 360
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
the MD Anderson Surgical Oncology Manual, Seventh Edition 300
Nucleophilic substitution in azasydnone-modified dinitroanisoles 300
Political Ideologies Their Origins and Impact 13th Edition 260
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3781132
求助须知:如何正确求助?哪些是违规求助? 3326623
关于积分的说明 10227813
捐赠科研通 3041744
什么是DOI,文献DOI怎么找? 1669585
邀请新用户注册赠送积分活动 799104
科研通“疑难数据库(出版商)”最低求助积分说明 758751