已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Learning Decentralized Traffic Signal Controllers with Multi-Agent Graph Reinforcement Learning

计算机科学 强化学习 可扩展性 图形 分布式计算 网络拓扑 可观测性 分散系统 理论计算机科学 拓扑(电路) 人工智能 控制(管理) 计算机网络 数学 组合数学 数据库 应用数学
作者
Yao Zhang,Zhiwen Yu,Jun Zhang,Liang Wang,Tom H. Luan,Bin Guo,Chau Yuen
出处
期刊:IEEE Transactions on Mobile Computing [Institute of Electrical and Electronics Engineers]
卷期号:: 1-16
标识
DOI:10.1109/tmc.2023.3332081
摘要

This paper considers optimal traffic signal control in smart cities, which has been taken as a complex networked system control problem. Given the interacting dynamics among traffic lights and road networks, attaining controller adaptivity and scalability stands out as a primary challenge. Capturing the spatial-temporal correlation among traffic lights under the framework of Multi-Agent Reinforcement Learning (MARL) is a promising solution. Nevertheless, existing MARL algorithms ignore effective information aggregation which is fundamental for improving the learning capacity of decentralized agents. In this paper, we design a new decentralized control architecture with improved environmental observability to capture the spatial-temporal correlation. Specifically, we first develop a topology-aware information aggregation strategy to extract correlation-related information from unstructured data gathered in the road network. Particularly, we transfer the road network topology into a graph shift operator by forming a diffusion process on the topology, which subsequently facilitates the construction of graph signals. A diffusion convolution module is developed, forming a new MARL algorithm, which endows agents with the capabilities of graph learning. Extensive experiments based on both synthetic and real-world datasets verify that our proposal outperforms existing decentralized algorithms.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
YKN发布了新的文献求助30
刚刚
半杯芒果茶完成签到,获得积分10
2秒前
千帆发布了新的文献求助10
3秒前
3秒前
传奇3应助盖博瑞拉采纳,获得10
4秒前
zgl完成签到,获得积分10
6秒前
CipherSage应助半杯芒果茶采纳,获得10
6秒前
7秒前
Solomon应助李默庵啊采纳,获得10
7秒前
9秒前
Solomon应助李默庵啊采纳,获得10
10秒前
佳期发布了新的文献求助10
10秒前
xuxuxuxuxu发布了新的文献求助10
11秒前
12秒前
科目三应助东方神齐采纳,获得10
13秒前
思源应助东方神齐采纳,获得10
13秒前
18秒前
xuxuxuxuxu完成签到,获得积分10
19秒前
20秒前
22秒前
Rainbow发布了新的文献求助10
25秒前
忧心的尔柳关注了科研通微信公众号
25秒前
CodeCraft应助郑zhenglanyou采纳,获得10
25秒前
26秒前
Long完成签到,获得积分10
26秒前
chiyudoubao完成签到 ,获得积分10
28秒前
所所应助佳期采纳,获得10
28秒前
28秒前
丘比特应助Long采纳,获得10
30秒前
30秒前
牛牛发布了新的文献求助10
31秒前
31秒前
34秒前
李博士完成签到,获得积分10
34秒前
Vichhkwx完成签到,获得积分10
34秒前
盖博瑞拉发布了新的文献求助10
35秒前
juile发布了新的文献求助10
37秒前
38秒前
sci完成签到 ,获得积分20
39秒前
JamesPei应助咪咪不吃糖采纳,获得10
42秒前
高分求助中
Sustainable Land Management: Strategies to Cope with the Marginalisation of Agriculture 1000
Corrosion and Oxygen Control 600
Yaws' Handbook of Antoine coefficients for vapor pressure 500
Python Programming for Linguistics and Digital Humanities: Applications for Text-Focused Fields 500
Love and Friendship in the Western Tradition: From Plato to Postmodernity 500
行動データの計算論モデリング 強化学習モデルを例として 500
Johann Gottlieb Fichte: Die späten wissenschaftlichen Vorlesungen / IV,1: ›Transzendentale Logik I (1812)‹ 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2556265
求助须知:如何正确求助?哪些是违规求助? 2180115
关于积分的说明 5622888
捐赠科研通 1901495
什么是DOI,文献DOI怎么找? 949874
版权声明 565592
科研通“疑难数据库(出版商)”最低求助积分说明 504832