From inverse optimal control to inverse reinforcement learning: A historical review

概化理论 机器学习 强化学习 控制(管理) 维数之咒 计算机科学 模仿 人工智能 数学 心理学 社会心理学 统计
作者
Nematollah Ab Azar,Aref Shahmansoorian,Mohsen Davoudi
出处
期刊:Annual Reviews in Control [Elsevier BV]
卷期号:50: 119-138 被引量:58
标识
DOI:10.1016/j.arcontrol.2020.06.001
摘要

Inverse optimal control (IOC) is a powerful theory that addresses the inverse problems in control systems, robotics, Machine Learning (ML) and optimization taking into account the optimal manners. This paper reviews the history of the IOC and Inverse Reinforcement Learning (IRL) approaches and describes the connections and differences between them to cover the research gap in the existing literature. The general formulation of IOC/IRL is described and the related methods are categorized based on a hierarchical approach. For this purpose, IOC methods are categorized under two classes, namely classic and modern approaches. The classic IOC is typically formulated for control systems, while IRL, as a modern approach to IOC, is considered for machine learning problems. Despite the presence of a handful of IOC/IRL methods, a comprehensive categorization of these methods is lacking. In addition to the IOC/IRL problems, this paper elaborates, where necessary, on other relevant concepts such as Learning from Demonstration (LfD), Imitation Learning (IL), and Behavioral Cloning. Some of the challenges encountered in the IOC/IRL problems are further discussed in this work, including ill-posedness, non-convexity, data availability, non-linearity, the curses of complexity and dimensionality, feature selection, and generalizability.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
星空_完成签到 ,获得积分10
刚刚
暖冬的向日葵完成签到,获得积分10
1秒前
xiaohu发布了新的文献求助10
1秒前
余志浩发布了新的文献求助10
1秒前
shang完成签到,获得积分10
2秒前
hugefrog发布了新的文献求助30
2秒前
2秒前
隐形曼青应助Cactus采纳,获得10
2秒前
2秒前
科研通AI5应助Cactus采纳,获得10
2秒前
3秒前
feixue完成签到,获得积分10
3秒前
Mida发布了新的文献求助10
4秒前
4秒前
Bio应助enen采纳,获得30
5秒前
剑影发布了新的文献求助10
5秒前
wang666完成签到,获得积分10
7秒前
一二完成签到 ,获得积分10
7秒前
haibing发布了新的文献求助10
7秒前
杨123完成签到,获得积分10
7秒前
Ray发布了新的文献求助10
8秒前
眼泪成诗发布了新的文献求助10
9秒前
冷傲妙梦发布了新的文献求助10
9秒前
10秒前
JUYe完成签到,获得积分10
10秒前
Owen应助周慧婷采纳,获得10
11秒前
彭于彦祖应助细腻友安采纳,获得30
12秒前
大白完成签到,获得积分10
12秒前
zy完成签到,获得积分10
13秒前
hugefrog完成签到,获得积分20
13秒前
顺心寄真完成签到,获得积分10
15秒前
Quincy完成签到,获得积分10
16秒前
Johnyang应助Mr采纳,获得10
16秒前
16秒前
阿萨德发布了新的文献求助10
17秒前
淡定幻翠发布了新的文献求助10
18秒前
00gi完成签到,获得积分10
18秒前
CodeCraft应助henny采纳,获得10
20秒前
吴彦祖发布了新的文献求助10
22秒前
小常发布了新的文献求助20
23秒前
高分求助中
(应助此贴封号)【重要!!请各位详细阅读】【科研通的精品贴汇总】 10000
中国兽药产业发展报告 1000
줄기세포 생물학 1000
Biodegradable Embolic Microspheres Market Insights 888
Quantum reference frames : from quantum information to spacetime 888
Pediatric Injectable Drugs 500
Instant Bonding Epoxy Technology 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4416743
求助须知:如何正确求助?哪些是违规求助? 3898697
关于积分的说明 12124655
捐赠科研通 3544428
什么是DOI,文献DOI怎么找? 1945126
邀请新用户注册赠送积分活动 985309
科研通“疑难数据库(出版商)”最低求助积分说明 881711