Interpretable Decision-Making for Autonomous Vehicles at Highway On-Ramps With Latent Space Reinforcement Learning

计算机科学 强化学习 人工智能 机器学习 马尔可夫决策过程
作者
Huanjie Wang,Hongbo Gao,Shihua Yuan,Hongfei Zhao,Kelong Wang,Xiulai Wang,Keqiang Li,Deyi Li
出处
期刊:IEEE Transactions on Vehicular Technology [Institute of Electrical and Electronics Engineers]
卷期号:70 (9): 8707-8719 被引量:1
标识
DOI:10.1109/tvt.2021.3098321
摘要

This paper presents a latent space reinforcement learning method for interpretable decision-making of autonomous vehicles at highway on-ramps. This method is based on the latent model and the combination model of the hidden Markov model and Gaussian mixture regression (HMM-GMR). It is difficult for the traditional decision-making method to understand the environment because its input is high-dimensional and lacks an understanding of the task. By utilizing the HMM-GMR model, we can obtain the interpretable state providing semantic information and environment understanding. A framework is proposed to unify representation learning with the deep reinforcement learning (DRL) approach, in which the latent model is used to reduce the dimension of interpretable state by extracting underlying task-relevant information. Experimental results are presented and the results show the right balance between driving safety and efficiency in the challenging scenarios of highway on-ramps merging.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
1秒前
元谷雪发布了新的文献求助10
2秒前
九Zy完成签到,获得积分10
2秒前
terry发布了新的文献求助20
2秒前
zhou完成签到,获得积分20
3秒前
SciGPT应助枫枫829采纳,获得10
3秒前
英勇MESSI完成签到,获得积分10
5秒前
6秒前
yangts2021发布了新的文献求助10
7秒前
ppat5012发布了新的文献求助10
7秒前
今后应助444采纳,获得10
8秒前
噼里啪啦发布了新的文献求助10
9秒前
9秒前
廉乐儿发布了新的文献求助10
14秒前
玖儿ovo完成签到,获得积分10
16秒前
Wang发布了新的文献求助10
19秒前
20秒前
21秒前
mc应助444采纳,获得10
23秒前
害羞满天完成签到 ,获得积分10
23秒前
噼里啪啦完成签到,获得积分10
24秒前
26秒前
xiaoliu关注了科研通微信公众号
27秒前
hu11完成签到,获得积分10
28秒前
安平完成签到,获得积分10
29秒前
手撕蛋完成签到 ,获得积分10
29秒前
静文完成签到,获得积分10
31秒前
Gauss完成签到,获得积分0
31秒前
Wang完成签到,获得积分10
32秒前
ppsparkling完成签到,获得积分20
33秒前
汤汤公主完成签到,获得积分10
34秒前
。。发布了新的文献求助100
35秒前
TRIZ完成签到 ,获得积分10
35秒前
cctv18应助科研通管家采纳,获得20
37秒前
orixero应助科研通管家采纳,获得10
37秒前
小蘑菇应助科研通管家采纳,获得10
37秒前
Lucas应助科研通管家采纳,获得10
37秒前
桐桐应助科研通管家采纳,获得10
37秒前
脑洞疼应助科研通管家采纳,获得20
37秒前
高分求助中
Manual of Clinical Microbiology, 4 Volume Set (ASM Books) 13th Edition 1000
Teaching Social and Emotional Learning in Physical Education 900
Edestus (Chondrichthyes, Elasmobranchii) from the Upper Carboniferous of Xinjiang, China 500
Chinese-English Translation Lexicon Version 3.0 500
Electronic Structure Calculations and Structure-Property Relationships on Aromatic Nitro Compounds 500
マンネンタケ科植物由来メロテルペノイド類の網羅的全合成/Collective Synthesis of Meroterpenoids Derived from Ganoderma Family 500
[Lambert-Eaton syndrome without calcium channel autoantibodies] 440
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2381922
求助须知:如何正确求助?哪些是违规求助? 2089088
关于积分的说明 5248404
捐赠科研通 1815908
什么是DOI,文献DOI怎么找? 906022
版权声明 558878
科研通“疑难数据库(出版商)”最低求助积分说明 483784