Reaching the limit in autonomous racing: Optimal control versus reinforcement learning

强化学习 机器人学 敏捷软件开发 计算机科学 人工智能 控制器(灌溉) 杠杆(统计) 机器人 弹道 控制工程 控制理论(社会学) 控制(管理) 工程类 农学 软件工程 生物 物理 天文
作者
Yunlong Song,Ángel Romero,Matthias M. Müller,Vladlen Koltun,Davide Scaramuzza
出处
期刊:Science robotics [American Association for the Advancement of Science]
卷期号:8 (82) 被引量:47
标识
DOI:10.1126/scirobotics.adg1462
摘要

A central question in robotics is how to design a control system for an agile mobile robot. This paper studies this question systematically, focusing on a challenging setting: autonomous drone racing. We show that a neural network controller trained with reinforcement learning (RL) outperformed optimal control (OC) methods in this setting. We then investigated which fundamental factors have contributed to the success of RL or have limited OC. Our study indicates that the fundamental advantage of RL over OC is not that it optimizes its objective better but that it optimizes a better objective. OC decomposes the problem into planning and control with an explicit intermediate representation, such as a trajectory, that serves as an interface. This decomposition limits the range of behaviors that can be expressed by the controller, leading to inferior control performance when facing unmodeled effects. In contrast, RL can directly optimize a task-level objective and can leverage domain randomization to cope with model uncertainty, allowing the discovery of more robust control responses. Our findings allowed us to push an agile drone to its maximum performance, achieving a peak acceleration greater than 12 times the gravitational acceleration and a peak velocity of 108 kilometers per hour. Our policy achieved superhuman control within minutes of training on a standard workstation. This work presents a milestone in agile robotics and sheds light on the role of RL and OC in robot control.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
清爽的火车完成签到 ,获得积分10
1秒前
Marshall完成签到 ,获得积分10
1秒前
AUGKING27完成签到 ,获得积分10
1秒前
Duke完成签到,获得积分10
6秒前
cheng完成签到 ,获得积分10
9秒前
海盗船长完成签到,获得积分10
9秒前
小学生学免疫完成签到 ,获得积分10
10秒前
11秒前
14秒前
认真丹亦完成签到 ,获得积分10
17秒前
fanfan完成签到 ,获得积分10
19秒前
hxpxp完成签到,获得积分10
21秒前
26秒前
鲁滨逊完成签到 ,获得积分10
28秒前
愉快无心完成签到 ,获得积分10
33秒前
was_3完成签到,获得积分0
34秒前
YuLu完成签到 ,获得积分10
35秒前
cherrychou完成签到,获得积分10
38秒前
游01完成签到 ,获得积分10
39秒前
蓝莓酱蘸橘子完成签到 ,获得积分10
41秒前
42秒前
43秒前
逢场作戱__完成签到 ,获得积分10
44秒前
奋斗小真发布了新的文献求助100
46秒前
小男孩完成签到,获得积分10
50秒前
绿袖子完成签到,获得积分10
52秒前
时尚丹寒完成签到 ,获得积分10
52秒前
执念完成签到 ,获得积分10
54秒前
summer完成签到,获得积分10
54秒前
jasmine发布了新的文献求助10
56秒前
秋迎夏完成签到,获得积分0
1分钟前
奇拉维特发布了新的文献求助10
1分钟前
要笑cc完成签到,获得积分10
1分钟前
lili完成签到 ,获得积分10
1分钟前
Jeffery426完成签到,获得积分10
1分钟前
宣宣宣0733完成签到,获得积分10
1分钟前
GankhuyagJavzan完成签到,获得积分10
1分钟前
胡质斌完成签到,获得积分10
1分钟前
孙乐777完成签到,获得积分10
1分钟前
我爱科研完成签到 ,获得积分10
1分钟前
高分求助中
Les Mantodea de Guyane Insecta, Polyneoptera 2500
Technologies supporting mass customization of apparel: A pilot project 450
A Field Guide to the Amphibians and Reptiles of Madagascar - Frank Glaw and Miguel Vences - 3rd Edition 400
Brain and Heart The Triumphs and Struggles of a Pediatric Neurosurgeon 400
Cybersecurity Blueprint – Transitioning to Tech 400
Mixing the elements of mass customisation 400
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3784835
求助须知:如何正确求助?哪些是违规求助? 3330072
关于积分的说明 10244317
捐赠科研通 3045457
什么是DOI,文献DOI怎么找? 1671691
邀请新用户注册赠送积分活动 800613
科研通“疑难数据库(出版商)”最低求助积分说明 759544