亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Multi-Agent Connected Autonomous Driving using Deep Reinforcement Learning

强化学习 计算机科学 可扩展性 自主代理人 交叉口(航空) 领域(数学分析) 马尔可夫决策过程 人工智能 集合(抽象数据类型) 部分可观测马尔可夫决策过程 过程(计算) 多智能体系统 分布式计算 马尔可夫链 人机交互 马尔可夫过程 机器学习 马尔可夫模型 工程类 统计 程序设计语言 数据库 操作系统 航空航天工程 数学分析 数学
作者
Praveen Palanisamy
标识
DOI:10.1109/ijcnn48605.2020.9207663
摘要

The capability to learn and adapt to changes in the driving environment is crucial for developing autonomous driving systems that are scalable beyond geo-fenced operational design domains. Deep Reinforcement Learning (RL) provides a promising and scalable framework for developing adaptive learning based solutions. Deep RL methods usually model the problem as a (Partially Observable) Markov Decision Process in which an agent acts in a stationary environment to learn an optimal behavior policy. However, driving involves complex interaction between multiple, intelligent (artificial or human) agents in a highly non-stationary environment. In this paper, we propose the use of Partially Observable Markov Games(POSG) for formulating the connected autonomous driving problems with realistic assumptions. We provide a taxonomy of multi-agent learning environments based on the nature of tasks, nature of agents and the nature of the environment to help in categorizing various autonomous driving problems that can be addressed under the proposed formulation. As our main contributions, we provide MACAD-Gym, a Multi-Agent Connected, Autonomous Driving agent learning platform for furthering research in this direction. Our MACAD-Gym platform provides an extensible set of Connected Autonomous Driving (CAD) simulation environments that enable the research and development of Deep RL- based integrated sensing, perception, planning and control algorithms for CAD systems with unlimited operational design domain under realistic, multi-agent settings. We also share the MACAD-Agents that were trained successfully using the MACAD-Gym platform to learn control policies for multiple vehicle agents in a partially observable, stop-sign controlled, 3-way urban intersection environment with raw (camera) sensor observations.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
沈玉琳发布了新的文献求助10
3秒前
4秒前
舒克发布了新的文献求助10
7秒前
光喵发布了新的文献求助10
8秒前
12秒前
14秒前
陶醉的向南完成签到,获得积分10
14秒前
17秒前
QueenQ完成签到,获得积分10
19秒前
心灵美语兰完成签到 ,获得积分10
24秒前
大苦瓜发布了新的文献求助10
26秒前
27秒前
29秒前
SciGPT应助可爱的秋采纳,获得10
32秒前
Li发布了新的文献求助10
34秒前
lxl发布了新的文献求助10
34秒前
38秒前
单薄的誉发布了新的文献求助10
44秒前
风趣猎豹完成签到,获得积分10
45秒前
光喵完成签到,获得积分20
45秒前
科研通AI6.4应助光喵采纳,获得10
50秒前
Ava应助林黛玉采纳,获得10
50秒前
爆米花应助lxl采纳,获得10
51秒前
陆康完成签到 ,获得积分10
1分钟前
艾则孜完成签到,获得积分10
1分钟前
沈玉琳完成签到,获得积分10
1分钟前
上官若男应助是老六呀采纳,获得30
1分钟前
bylee发布了新的文献求助20
1分钟前
SciGPT应助单薄的誉采纳,获得10
1分钟前
1分钟前
1分钟前
Boris发布了新的文献求助10
1分钟前
科目三应助bylee采纳,获得10
1分钟前
lxl发布了新的文献求助10
1分钟前
啊呀完成签到,获得积分10
1分钟前
不想起昵称完成签到 ,获得积分0
2分钟前
2分钟前
bylee发布了新的文献求助10
2分钟前
Hello应助lxl采纳,获得10
2分钟前
帝蒼完成签到,获得积分10
2分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
The formation of Australian attitudes towards China, 1918-1941 640
Signals, Systems, and Signal Processing 610
Development Across Adulthood 600
天津市智库成果选编 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6444311
求助须知:如何正确求助?哪些是违规求助? 8258214
关于积分的说明 17590948
捐赠科研通 5503336
什么是DOI,文献DOI怎么找? 2901308
邀请新用户注册赠送积分活动 1878358
关于科研通互助平台的介绍 1717628