Air-M: A Visual Reality Many-Agent Reinforcement Learning Platform for Large-Scale Aerial Unmanned System

可扩展性 软件部署 强化学习 计算机科学 无人机 虚拟现实 机器人学 群机器人 人工智能 机器人 分布式计算 群体行为 虚拟机 容器(类型理论) 实时计算 工程类 操作系统 机械工程 遗传学 生物
作者
Jiabin Lou,Wenjun Wu,Shuhao Liao,Rongye Shi
标识
DOI:10.1109/iros55552.2023.10341405
摘要

Reinforcement learning for swarms of flying robots is a challenging task that requires a large number of data samples. Moreover, the problem of sim-to-real transfer has long been a challenge in robotics algorithm deployment. To address these issues, we propose Air-M, a platform that facilitates large-scale drone swarm learning in a distributed docker container environment and deployment in a virtual reality setting. Air-M trains the policy network using physics engines and creates replicas of agents in docker containers, which helps amortize the computational cost. In addition, Air-M establishes an intermediate link between the simulation and the real world, allowing real drones to interact with virtual objects via virtual sensors. This enables the policy network to be trained using virtual agents and seamlessly transferred to real drones. Air-Mis highly scalable, accommodating hundreds of agents with dynamic models and virtual sensors. We evaluate the effectiveness of our approach by conducting experiments in three representative virtual scenarios with an increasing number of agents. Our results demonstrate that our method outperforms the state-of- the-art in terms of training efficiency and transferability, making it a promising platform for swarm robotics applications.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
Kevin完成签到,获得积分10
刚刚
阳先生发布了新的文献求助10
1秒前
2秒前
鱼蛋发布了新的文献求助10
2秒前
Gauss应助细心的糖豆采纳,获得30
2秒前
2秒前
快乐紫白猫猫头完成签到,获得积分10
2秒前
3秒前
朵拉完成签到,获得积分10
3秒前
黑色幽默发布了新的文献求助10
4秒前
5秒前
Eason完成签到,获得积分10
5秒前
5秒前
6秒前
HDrinnk完成签到,获得积分10
6秒前
聪明的tracy完成签到,获得积分10
6秒前
子春完成签到 ,获得积分10
7秒前
干雅柏发布了新的文献求助10
8秒前
青雉发布了新的文献求助10
8秒前
8秒前
hahastock发布了新的文献求助10
8秒前
8秒前
沉静河马完成签到 ,获得积分10
8秒前
8秒前
auuu完成签到,获得积分10
8秒前
Sylas发布了新的文献求助10
8秒前
英俊萧发布了新的文献求助10
9秒前
hailiangzheng完成签到,获得积分10
9秒前
10秒前
JDM完成签到 ,获得积分10
10秒前
12秒前
吕健发布了新的文献求助10
12秒前
莘晟完成签到,获得积分10
12秒前
刘悦发布了新的文献求助10
13秒前
13秒前
13秒前
哒哒发布了新的文献求助10
13秒前
可乐完成签到,获得积分10
13秒前
13秒前
高分求助中
Applied Survey Data Analysis (第三版, 2025) 800
Assessing and Diagnosing Young Children with Neurodevelopmental Disorders (2nd Edition) 700
Images that translate 500
Algorithmic Mathematics in Machine Learning 500
Handbook of Innovations in Political Psychology 400
Mapping the Stars: Celebrity, Metonymy, and the Networked Politics of Identity 400
Nucleophilic substitution in azasydnone-modified dinitroanisoles 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3842288
求助须知:如何正确求助?哪些是违规求助? 3384399
关于积分的说明 10534504
捐赠科研通 3104830
什么是DOI,文献DOI怎么找? 1709838
邀请新用户注册赠送积分活动 823410
科研通“疑难数据库(出版商)”最低求助积分说明 774050