Reinforcement Learning and Feedback Control: Using Natural Decision Methods to Design Optimal Adaptive Controllers

汉密尔顿-雅各比-贝尔曼方程 控制理论(社会学) 最优控制 自适应控制 强化学习 代数Riccati方程 非线性系统 动力系统理论 计算机科学 控制工程 Riccati方程 系统标识 线性二次高斯控制 数学优化 控制(管理) 数学 人工智能 微分方程 工程类 数据建模 物理 数学分析 数据库 量子力学
作者
Frank L. Lewis,Draguna Vrabie,Kyriakos G. Vamvoudakis
出处
期刊:IEEE Control Systems Magazine [Institute of Electrical and Electronics Engineers]
卷期号:32 (6): 76-105 被引量:981
标识
DOI:10.1109/mcs.2012.2214134
摘要

This article describes the use of principles of reinforcement learning to design feedback controllers for discrete- and continuous-time dynamical systems that combine features of adaptive control and optimal control. Adaptive control [1], [2] and optimal control [3] represent different philosophies for designing feedback controllers. Optimal controllers are normally designed of ine by solving Hamilton JacobiBellman (HJB) equations, for example, the Riccati equation, using complete knowledge of the system dynamics. Determining optimal control policies for nonlinear systems requires the offline solution of nonlinear HJB equations, which are often difficult or impossible to solve. By contrast, adaptive controllers learn online to control unknown systems using data measured in real time along the system trajectories. Adaptive controllers are not usually designed to be optimal in the sense of minimizing user-prescribed performance functions. Indirect adaptive controllers use system identification techniques to first identify the system parameters and then use the obtained model to solve optimal design equations [1]. Adaptive controllers may satisfy certain inverse optimality conditions [4].
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
孟一完成签到,获得积分10
1秒前
浮游应助lisier采纳,获得10
1秒前
Olivia完成签到 ,获得积分10
2秒前
2秒前
量子星尘发布了新的文献求助10
2秒前
紫色翡翠发布了新的文献求助10
3秒前
资新烟完成签到 ,获得积分10
3秒前
4秒前
李李李发布了新的文献求助10
4秒前
传奇3应助琦琦采纳,获得10
5秒前
浮游应助晨儿采纳,获得10
5秒前
6秒前
悦耳的雍发布了新的文献求助30
7秒前
我一拳打树上完成签到,获得积分10
8秒前
9秒前
11秒前
浮游应助lisier采纳,获得10
14秒前
浮游应助ycsqz采纳,获得10
14秒前
sun完成签到,获得积分10
14秒前
16秒前
大模型应助888采纳,获得10
18秒前
红糖馒头发布了新的文献求助10
19秒前
19秒前
20秒前
泰山球迷发布了新的文献求助10
20秒前
20秒前
fufufu123完成签到 ,获得积分10
21秒前
丘比特应助科研通管家采纳,获得10
22秒前
浮游应助科研通管家采纳,获得10
22秒前
科研通AI6应助科研通管家采纳,获得10
22秒前
希望天下0贩的0应助fjh采纳,获得10
22秒前
22秒前
小二郎应助科研通管家采纳,获得10
22秒前
在水一方应助科研通管家采纳,获得10
22秒前
田様应助科研通管家采纳,获得10
23秒前
牧野七完成签到,获得积分20
23秒前
xxfsx应助科研通管家采纳,获得10
23秒前
Lucas应助科研通管家采纳,获得10
23秒前
23秒前
情怀应助科研通管家采纳,获得10
23秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
List of 1,091 Public Pension Profiles by Region 1001
The Antibodies, Vol. 2,3,4,5,6 1000
Clinical Microbiology Procedures Handbook, Multi-Volume, 5th Edition 1000
On the application of advanced modeling tools to the SLB analysis in NuScale. Part I: TRACE/PARCS, TRACE/PANTHER and ATHLET/DYN3D 500
L-Arginine Encapsulated Mesoporous MCM-41 Nanoparticles: A Study on In Vitro Release as Well as Kinetics 500
Virus-like particles empower RNAi for effective control of a Coleopteran pest 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5461993
求助须知:如何正确求助?哪些是违规求助? 4566819
关于积分的说明 14307725
捐赠科研通 4492739
什么是DOI,文献DOI怎么找? 2461223
邀请新用户注册赠送积分活动 1450186
关于科研通互助平台的介绍 1425742