Combining Reinforcement Learning with Model Predictive Control for On-Ramp Merging

强化学习 计算机科学 稳健性(进化) 模型预测控制 合并(版本控制) 撞车 人工智能 控制(管理) 情报检索 生物化学 基因 化学 程序设计语言
作者
Joseph Lubars,Harsh Gupta,Sandeep Chinchali,Liyun Li,Adnan Raja,R. Srikant,Xinzhou Wu
标识
DOI:10.1109/itsc48978.2021.9564954
摘要

We consider the problem of designing an algorithm to allow a car to autonomously merge on to a highway from an on-ramp. Two broad classes of techniques have been proposed to solve motion planning problems in autonomous driving: Model Predictive Control (MPC) and Reinforcement Learning (RL). In this paper, we first establish the strengths and weaknesses of state-of-the-art MPC and RL-based techniques through simulations. We show that the performance of the RL agent is worse than that of the MPC solution from the perspective of safety and robustness to out-of-distribution traffic patterns, i.e., traffic patterns which were not seen by the RL agent during training. On the other hand, the performance of the RL agent is better than that of the MPC solution when it comes to efficiency and passenger comfort. We subsequently present an algorithm which blends the model-free RL agent with the MPC solution and show that it provides better tradeoffs between all metrics - passenger comfort, efficiency, crash rate and robustness.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Spice完成签到 ,获得积分10
2秒前
实验室的篮球运动员完成签到,获得积分10
4秒前
娟娟完成签到 ,获得积分10
5秒前
liao_duoduo完成签到 ,获得积分10
8秒前
量子星尘发布了新的文献求助10
8秒前
ZHANG完成签到 ,获得积分10
15秒前
Tysonqu完成签到,获得积分10
15秒前
Jeffrey完成签到,获得积分0
20秒前
小刺猬完成签到,获得积分10
24秒前
jackhlj完成签到,获得积分10
25秒前
量子星尘发布了新的文献求助10
29秒前
七街完成签到 ,获得积分10
36秒前
柳树完成签到,获得积分10
37秒前
Mars完成签到,获得积分10
40秒前
zhechen完成签到,获得积分10
41秒前
壮观的谷冬完成签到 ,获得积分0
42秒前
dskuyy完成签到 ,获得积分20
48秒前
mdmdd完成签到,获得积分10
48秒前
swordshine完成签到,获得积分0
48秒前
SW冒险家完成签到 ,获得积分10
48秒前
50秒前
ypres完成签到 ,获得积分10
50秒前
52秒前
55秒前
海不扬波发布了新的文献求助10
55秒前
海不扬波发布了新的文献求助10
55秒前
海不扬波发布了新的文献求助10
55秒前
海不扬波发布了新的文献求助10
56秒前
海不扬波发布了新的文献求助10
56秒前
海不扬波发布了新的文献求助30
56秒前
海不扬波发布了新的文献求助30
56秒前
含蓄的孤丝完成签到 ,获得积分10
58秒前
缓慢的甜瓜完成签到,获得积分10
58秒前
海不扬波发布了新的文献求助30
59秒前
海不扬波发布了新的文献求助10
59秒前
小皮艇完成签到 ,获得积分10
1分钟前
眼睛大初翠完成签到 ,获得积分20
1分钟前
luobote完成签到 ,获得积分10
1分钟前
量子星尘发布了新的文献求助10
1分钟前
99完成签到 ,获得积分10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Kinesiophobia : a new view of chronic pain behavior 2000
Cronologia da história de Macau 1600
BRITTLE FRACTURE IN WELDED SHIPS 1000
Lloyd's Register of Shipping's Approach to the Control of Incidents of Brittle Fracture in Ship Structures 1000
Developmental Peace: Theorizing China’s Approach to International Peacebuilding 1000
Traitements Prothétiques et Implantaires de l'Édenté total 2.0 1000
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 纳米技术 计算机科学 化学工程 生物化学 物理 复合材料 内科学 催化作用 物理化学 光电子学 细胞生物学 基因 电极 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6136183
求助须知:如何正确求助?哪些是违规求助? 7963219
关于积分的说明 16526613
捐赠科研通 5251133
什么是DOI,文献DOI怎么找? 2803903
邀请新用户注册赠送积分活动 1784913
关于科研通互助平台的介绍 1655503