亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Multi-agent reinforcement learning by the actor-critic model with an attention interface

计算机科学 强化学习 可见的 接口(物质) 光学(聚焦) 人工智能 感知 分布式计算 量子力学 生物 光学 物理 最大气泡压力法 气泡 神经科学 并行计算
作者
Lixiang Zhang,Jingchen Li,Yanzi Zhu,Haobin Shi,Kao-Shing Hwang
出处
期刊:Neurocomputing [Elsevier]
卷期号:471: 275-284 被引量:8
标识
DOI:10.1016/j.neucom.2021.06.049
摘要

Multi-agent reinforcement learning algorithms have achieved satisfactory performances in various scenarios, but many of them encounter difficulties in partially observable environments. In partially observable environments, the inability to perceive environment states results in unsteadiness and misconvergence, especially in large-scale multi-agent environments. To improve interactions among homogeneous agents in a partially observable environment, we propose a novel multi-agent actor-critic model with a visual attention interface to solve this problem. First, a recurrent visual attention interface is used to extract a latent state from each agent’s partial observation. These latent states allow agents to focus on several local environments, in which each agent has a complete perception of a local environment and the intricate multi-agent environment is teased out by the interaction among several agents in the same local environment. The proposed method trains multi-agent systems with a centralized training and decentralized execution mechanism. The joint action of agents is approximated by the mean-field theory because the number of agents in a local environment is uncertain. Experimental results on the simulation platform suggest that our model performs better when training large-scale multi-agent systems in partially observable environments than baselines.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
van_完成签到,获得积分10
1秒前
小秦应助面向杂志编论文采纳,获得30
7秒前
wanci应助van_采纳,获得30
8秒前
Wang完成签到 ,获得积分20
22秒前
爱民发布了新的文献求助10
28秒前
萱萱发布了新的文献求助10
32秒前
33秒前
唐汉发布了新的文献求助10
36秒前
深情安青应助唐汉采纳,获得10
46秒前
NexusExplorer应助萱萱采纳,获得10
59秒前
2分钟前
别来无恙发布了新的文献求助10
2分钟前
彩色德天发布了新的文献求助10
2分钟前
2分钟前
2分钟前
萱萱发布了新的文献求助10
2分钟前
小马甲应助萱萱采纳,获得10
2分钟前
2分钟前
2分钟前
lulu完成签到,获得积分10
2分钟前
van_发布了新的文献求助30
2分钟前
lulu发布了新的文献求助10
2分钟前
3分钟前
唐汉发布了新的文献求助10
3分钟前
CodeCraft应助唐汉采纳,获得10
3分钟前
Otter完成签到,获得积分10
3分钟前
4分钟前
唐汉发布了新的文献求助10
4分钟前
今后应助唐汉采纳,获得10
4分钟前
彩色德天完成签到,获得积分10
5分钟前
彩色德天发布了新的文献求助10
5分钟前
魏白晴完成签到,获得积分10
5分钟前
5分钟前
Chief完成签到,获得积分10
5分钟前
5分钟前
小二郎应助韭菜盒子采纳,获得10
6分钟前
6分钟前
6分钟前
唐汉发布了新的文献求助10
6分钟前
情怀应助韭菜盒子采纳,获得10
6分钟前
高分求助中
The Illustrated History of Gymnastics 800
The Bourse of Babylon : market quotations in the astronomical diaries of Babylonia 680
Peripheral Blood miR-148 Serves as a Novel Biomarker in Ulcerative Colitis Patients 500
Division and square root. Digit-recurrence algorithms and implementations 500
機能營養學前瞻(3 Ed.) 300
Problems of transcultural communication 300
Zwischen Selbstbestimmung und Selbstbehauptung 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2505622
求助须知:如何正确求助?哪些是违规求助? 2158022
关于积分的说明 5523641
捐赠科研通 1878546
什么是DOI,文献DOI怎么找? 934342
版权声明 563975
科研通“疑难数据库(出版商)”最低求助积分说明 499080