Regional Multi-Agent Cooperative Reinforcement Learning for City-Level Traffic Grid Signal Control

强化学习 交通信号灯 网格 计算机科学 钢筋 控制(管理) 信号(编程语言) 运输工程 人工智能 实时计算 心理学 地理 工程类 社会心理学 大地测量学 程序设计语言
作者
Yisha Li,Ya Zhang,Xinde Li,Changyin Sun
出处
期刊:IEEE/CAA Journal of Automatica Sinica [Institute of Electrical and Electronics Engineers]
卷期号:11 (9): 1987-1998 被引量:19
标识
DOI:10.1109/jas.2024.124365
摘要

This article studies the effective traffic signal control problem of multiple intersections in a city-level traffic system. A novel regional multi-agent cooperative reinforcement learning algorithm called RegionSTLight is proposed to improve the traffic efficiency. Firstly a regional multi-agent Q-learning framework is proposed, which can equivalently decompose the global Q value of the traffic system into the local values of several regions. Based on the framework and the idea of human-machine cooperation, a dynamic zoning method is designed to divide the traffic network into several strong-coupled regions according to real-time traffic flow densities. In order to achieve better cooperation inside each region, a lightweight spatio-temporal fusion feature extraction network is designed. The experiments in synthetic, real-world and city-level scenarios show that the proposed RegionSTLight converges more quickly, is more stable, and obtains better asymptotic performance compared to state-of-the-art models.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
完美世界应助夏姬宁静采纳,获得10
1秒前
123完成签到,获得积分10
2秒前
小蘑菇应助bono采纳,获得10
2秒前
2秒前
Azhar发布了新的文献求助10
2秒前
lucygaga发布了新的文献求助10
3秒前
wushangyu发布了新的文献求助10
4秒前
完美凝海完成签到 ,获得积分10
5秒前
lll发布了新的文献求助30
5秒前
yishang发布了新的文献求助10
6秒前
7秒前
8秒前
zdsq完成签到,获得积分10
9秒前
Yao应助wongkong采纳,获得10
10秒前
小六九完成签到 ,获得积分10
12秒前
郭团团发布了新的文献求助10
12秒前
自信的老头完成签到,获得积分10
13秒前
13秒前
More应助清逸之风采纳,获得10
15秒前
15秒前
orixero应助wushangyu采纳,获得10
15秒前
小J完成签到,获得积分10
18秒前
MMM发布了新的文献求助10
19秒前
NexusExplorer应助ssy采纳,获得10
20秒前
20秒前
水穷云起完成签到,获得积分10
22秒前
CFD应助超子采纳,获得10
23秒前
阴天快乐完成签到,获得积分10
27秒前
jia完成签到 ,获得积分10
28秒前
狒狒完成签到 ,获得积分10
28秒前
hanZH完成签到,获得积分10
28秒前
思源应助郝文彩采纳,获得10
30秒前
迷你的定帮完成签到,获得积分20
30秒前
31秒前
文静人达完成签到 ,获得积分10
31秒前
17关注了科研通微信公众号
33秒前
雪白的雪完成签到,获得积分10
35秒前
bono发布了新的文献求助10
36秒前
37秒前
Ava应助xiaobai采纳,获得10
37秒前
高分求助中
Invited Discussant 63O and 64O 1000
Ideology and Meaning-Making under the Putin Regime 750
Petrology and Plate Tectonics 500
A Handbook of User Experience Research & Design in Libraries 400
Understanding Modeling and Simulation of Polymerization Reactions 400
Direct and Iterative Linear System Solvers 400
《KNN基无铅压电陶瓷电学性能优化与物理机理研究》 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 计算机科学 化学工程 生物化学 物理 内科学 复合材料 催化作用 光电子学 物理化学 电极 细胞生物学 基因 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6904466
求助须知:如何正确求助?哪些是违规求助? 8598240
关于积分的说明 18252912
捐赠科研通 6307120
什么是DOI,文献DOI怎么找? 3063569
关于科研通互助平台的介绍 2085990
邀请新用户注册赠送积分活动 2041366