Scalable Reinforcement Learning for Multiagent Networked Systems

强化学习 维数之咒 可扩展性 计算机科学 利用 分布式计算 钥匙(锁) 状态空间 比例(比率) 人工智能 计算机安全 数学 量子力学 数据库 统计 物理
作者
Guannan Qu,Adam Wierman,Na Li
出处
期刊:Operations Research [Institute for Operations Research and the Management Sciences]
卷期号:70 (6): 3601-3628 被引量:12
标识
DOI:10.1287/opre.2021.2226
摘要

Highlighted by success stories like AlphaGo, reinforcement learning (RL) has emerged as a powerful tool for decision making in complex environments. However, the success of RL has thus far been limited to small-scale or single-agent systems. To apply RL to large-scale networked systems such as energy, transportation, and communication networks, a critical hurdle is the curse of dimensionality, because for these systems, the state and action space can be exponentially large in the number of nodes in the network. This article attempts to break this curse of dimensionality and designs a scalable RL method, named scalable actor critic (SAC), for large networked systems. The key technical contribution is to exploit the network structure to derive an exponential decay property, which enables the design of the SAC approach.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
刚刚
刚刚
1秒前
CodeCraft应助yt采纳,获得10
2秒前
ding应助哈哈哈采纳,获得10
2秒前
领导范儿应助哈哈哈采纳,获得10
2秒前
4秒前
滕皓轩发布了新的文献求助10
4秒前
4秒前
机灵白桃发布了新的文献求助30
6秒前
6秒前
Jane发布了新的文献求助10
6秒前
star发布了新的文献求助10
7秒前
66666完成签到 ,获得积分10
7秒前
jenningseastera应助青wu采纳,获得10
7秒前
8秒前
醉书生应助PYM采纳,获得20
9秒前
善学以致用应助烂漫剑采纳,获得10
9秒前
Pinkie完成签到 ,获得积分10
9秒前
10秒前
嗨害害发布了新的文献求助10
12秒前
隐形曼青应助明钟达采纳,获得10
12秒前
研友_Z60ObL完成签到,获得积分10
13秒前
jkdajsk发布了新的文献求助10
13秒前
小乐比发布了新的文献求助10
15秒前
15秒前
16秒前
塵埃发布了新的文献求助10
16秒前
17秒前
wanci应助嗨害害采纳,获得10
18秒前
脑洞疼应助wdw2501采纳,获得10
19秒前
jkdajsk完成签到,获得积分10
20秒前
SIHUONIANHUA发布了新的文献求助10
20秒前
20秒前
李亦书发布了新的文献求助10
21秒前
star发布了新的文献求助10
22秒前
滕皓轩发布了新的文献求助10
22秒前
22秒前
22秒前
高分求助中
Les Mantodea de Guyane Insecta, Polyneoptera 2500
Mobilization, center-periphery structures and nation-building 600
Introduction to Strong Mixing Conditions Volumes 1-3 500
Technologies supporting mass customization of apparel: A pilot project 450
China—Art—Modernity: A Critical Introduction to Chinese Visual Expression from the Beginning of the Twentieth Century to the Present Day 430
Multichannel rotary joints-How they work 400
Tip60 complex regulates eggshell formation and oviposition in the white-backed planthopper, providing effective targets for pest control 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3794706
求助须知:如何正确求助?哪些是违规求助? 3339486
关于积分的说明 10296205
捐赠科研通 3056183
什么是DOI,文献DOI怎么找? 1676910
邀请新用户注册赠送积分活动 804935
科研通“疑难数据库(出版商)”最低求助积分说明 762226