Combining Reinforcement Learning with Model Predictive Control for On-Ramp Merging

强化学习 计算机科学 稳健性(进化) 模型预测控制 合并(版本控制) 撞车 人工智能 控制(管理) 情报检索 生物化学 基因 化学 程序设计语言
作者
Joseph Lubars,Harsh Gupta,Sandeep Chinchali,Liyun Li,Adnan Raja,R. Srikant,Xinzhou Wu
标识
DOI:10.1109/itsc48978.2021.9564954
摘要

We consider the problem of designing an algorithm to allow a car to autonomously merge on to a highway from an on-ramp. Two broad classes of techniques have been proposed to solve motion planning problems in autonomous driving: Model Predictive Control (MPC) and Reinforcement Learning (RL). In this paper, we first establish the strengths and weaknesses of state-of-the-art MPC and RL-based techniques through simulations. We show that the performance of the RL agent is worse than that of the MPC solution from the perspective of safety and robustness to out-of-distribution traffic patterns, i.e., traffic patterns which were not seen by the RL agent during training. On the other hand, the performance of the RL agent is better than that of the MPC solution when it comes to efficiency and passenger comfort. We subsequently present an algorithm which blends the model-free RL agent with the MPC solution and show that it provides better tradeoffs between all metrics - passenger comfort, efficiency, crash rate and robustness.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
缓慢听枫发布了新的文献求助10
刚刚
哈哈哈大赞完成签到,获得积分10
刚刚
刚刚
1秒前
yiding发布了新的文献求助10
1秒前
111发布了新的文献求助10
1秒前
zaphkiel发布了新的文献求助10
1秒前
dd发布了新的文献求助10
2秒前
六六完成签到,获得积分10
2秒前
沙瑞金完成签到,获得积分10
2秒前
个性的惜筠完成签到,获得积分10
2秒前
2秒前
大大彬发布了新的文献求助10
3秒前
3秒前
3秒前
滕遥完成签到,获得积分10
3秒前
科研通AI5应助sunyexuan采纳,获得10
4秒前
WLLLR发布了新的文献求助10
5秒前
Hello应助缓慢钢笔采纳,获得10
5秒前
英俊的铭应助是问采纳,获得10
5秒前
6秒前
领导范儿应助芹菜采纳,获得10
6秒前
阮楷瑞发布了新的文献求助10
7秒前
7秒前
科研通AI5应助张晗采纳,获得10
7秒前
tian发布了新的文献求助10
7秒前
知名不具完成签到 ,获得积分10
8秒前
8秒前
哈哈发布了新的文献求助10
8秒前
吴晨曦发布了新的文献求助10
9秒前
张先生2365完成签到,获得积分10
10秒前
麦当劳薯条完成签到,获得积分10
10秒前
12秒前
12秒前
zaphkiel完成签到,获得积分10
12秒前
哦哦哦发布了新的文献求助10
12秒前
13秒前
科研通AI5应助周心雨采纳,获得10
13秒前
最爱小胖宝的大胖宝完成签到,获得积分10
14秒前
肉卷子完成签到,获得积分10
14秒前
高分求助中
Les Mantodea de Guyane Insecta, Polyneoptera 2500
Encyclopedia of Geology (2nd Edition) 2000
Technologies supporting mass customization of apparel: A pilot project 450
Tip60 complex regulates eggshell formation and oviposition in the white-backed planthopper, providing effective targets for pest control 400
A Field Guide to the Amphibians and Reptiles of Madagascar - Frank Glaw and Miguel Vences - 3rd Edition 400
Brain and Heart The Triumphs and Struggles of a Pediatric Neurosurgeon 400
Cybersecurity Blueprint – Transitioning to Tech 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3786497
求助须知:如何正确求助?哪些是违规求助? 3332246
关于积分的说明 10254811
捐赠科研通 3047627
什么是DOI,文献DOI怎么找? 1672635
邀请新用户注册赠送积分活动 801445
科研通“疑难数据库(出版商)”最低求助积分说明 760204