A new Q‐function structure for model‐free adaptive optimal tracking control with asymmetric constrained inputs

控制理论(社会学) 跟踪误差 趋同(经济学) 最优控制 功能(生物学) 单调函数 转化(遗传学) 控制器(灌溉) 数学优化 计算机科学 迭代学习控制 非线性系统 人工神经网络 理论(学习稳定性) 自适应控制 力矩(物理) 数学 控制(管理) 人工智能 进化生物学 生物 数学分析 生物化学 化学 物理 经典力学 量子力学 机器学习 基因 农学 经济 经济增长
作者
Mingming Zhao,Ding Wang,Menghua Li,Ning Gao,Junfei Qiao
出处
期刊:International Journal of Adaptive Control and Signal Processing [Wiley]
卷期号:38 (5): 1561-1578 被引量:3
标识
DOI:10.1002/acs.3761
摘要

Summary This article aims to design a model‐free adaptive tracking controller for discrete‐time nonlinear systems with unknown dynamics and asymmetric control constraints. First, a new Q‐function structure is designed by introducing the control input into the tracking error of the next moment, in order to eliminate the final tracking error, avoid the steady control, and ignore the discount factor. Second, via system transformation, a general performance index is developed to overcome the challenge caused by asymmetric constraints of implicit control inputs. By this operation, the constrained tracking problem is converted to an unconstrained optimal tracking problem without the traditional nonquadratic performance function that is only applicable to explicit control inputs. Then, a value‐iteration‐based Q‐learning (VIQL) algorithm is derived to seek the optimal Q‐function and the optimal control policy by using offline data rather than the mathematical model. Next, the convergence, monotonicity, and stability properties of VIQL are investigated to demonstrate that the iterative Q‐function sequence can converge to the optimal Q‐function under ideal conditions. To realize the VIQL algorithm, the critic neural network is employed to approximate the Q‐function. Finally, simulation results and comparative experiments are conducted to demonstrate the validity and effectiveness of the present VIQL scheme.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
DAI完成签到,获得积分10
5秒前
shaft完成签到,获得积分10
8秒前
科研通AI5应助崔玉婷采纳,获得10
13秒前
BCKT完成签到,获得积分10
18秒前
19秒前
mendicant完成签到,获得积分10
24秒前
VirSnorlax完成签到,获得积分10
32秒前
艾瑞克完成签到,获得积分10
32秒前
四叶草完成签到 ,获得积分10
34秒前
典雅葶完成签到 ,获得积分10
34秒前
37秒前
Ray完成签到 ,获得积分10
43秒前
阿M啊啊完成签到 ,获得积分10
45秒前
安安的小板栗完成签到,获得积分10
53秒前
大个应助愿景采纳,获得10
56秒前
蓝桉完成签到 ,获得积分10
57秒前
59秒前
艾瑞克完成签到,获得积分10
1分钟前
Haonan完成签到,获得积分10
1分钟前
stk完成签到,获得积分10
1分钟前
阿一完成签到 ,获得积分10
1分钟前
小粒橙完成签到 ,获得积分10
1分钟前
易吴鱼完成签到 ,获得积分10
1分钟前
momo完成签到,获得积分10
1分钟前
孙刚完成签到 ,获得积分10
1分钟前
bkagyin应助WangY1263采纳,获得10
1分钟前
艾瑞克完成签到,获得积分10
1分钟前
木羡完成签到 ,获得积分10
1分钟前
Faceless完成签到,获得积分10
1分钟前
1分钟前
dbdxyty完成签到,获得积分10
1分钟前
WangY1263发布了新的文献求助10
1分钟前
豌豆应助科研通管家采纳,获得10
1分钟前
cdercder应助科研通管家采纳,获得10
1分钟前
cdercder应助科研通管家采纳,获得10
1分钟前
星辰大海应助科研通管家采纳,获得10
1分钟前
天天快乐应助科研通管家采纳,获得10
1分钟前
Singularity应助科研通管家采纳,获得10
1分钟前
1分钟前
PhishCellar完成签到 ,获得积分10
1分钟前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
ISCN 2024 – An International System for Human Cytogenomic Nomenclature (2024) 3000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
Maneuvering of a Damaged Navy Combatant 650
Mindfulness and Character Strengths: A Practitioner's Guide to MBSP 380
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3776051
求助须知:如何正确求助?哪些是违规求助? 3321626
关于积分的说明 10206478
捐赠科研通 3036712
什么是DOI,文献DOI怎么找? 1666435
邀请新用户注册赠送积分活动 797439
科研通“疑难数据库(出版商)”最低求助积分说明 757841