Learning agile soccer skills for a bipedal robot with deep reinforcement learning

强化学习 敏捷软件开发 钢筋 人工智能 机器人 计算机科学 工程类 结构工程 软件工程
作者
Tuomas Haarnoja,Bryan D. Moran,Guy Lever,Sandy H. Huang,Dhruva Tirumala,Jan Humplík,Markus Wulfmeier,Saran Tunyasuvunakool,Noah Siegel,Roland Hafner,Michael Bloesch,Kristian Hartikainen,Arunkumar Byravan,Leonard Hasenclever,Yuval Tassa,Fereshteh Sadeghi,Nathan Batchelor,Federico Casarini,Stefano Saliceti,Charles Game,Neil Sreendra,Kushal Patel,Marlon Gwira,Andrea Huber,Nicole Hurley,Francesco Nori,Raia Hadsell,Nicolas Heess
出处
期刊:Science robotics [American Association for the Advancement of Science (AAAS)]
卷期号:9 (89)
标识
DOI:10.1126/scirobotics.adi8022
摘要

We investigated whether deep reinforcement learning (deep RL) is able to synthesize sophisticated and safe movement skills for a low-cost, miniature humanoid robot that can be composed into complex behavioral strategies. We used deep RL to train a humanoid robot to play a simplified one-versus-one soccer game. The resulting agent exhibits robust and dynamic movement skills, such as rapid fall recovery, walking, turning, and kicking, and it transitions between them in a smooth and efficient manner. It also learned to anticipate ball movements and block opponent shots. The agent's tactical behavior adapts to specific game contexts in a way that would be impractical to manually design. Our agent was trained in simulation and transferred to real robots zero-shot. A combination of sufficiently high-frequency control, targeted dynamics randomization, and perturbations during training enabled good-quality transfer. In experiments, the agent walked 181% faster, turned 302% faster, took 63% less time to get up, and kicked a ball 34% faster than a scripted baseline.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
沉静傲易发布了新的文献求助10
2秒前
鲤鱼无心发布了新的文献求助10
2秒前
负责的流沙完成签到,获得积分10
3秒前
4秒前
kaja发布了新的文献求助10
6秒前
酷波er应助傻傻的凌寒采纳,获得10
9秒前
11秒前
13秒前
大耳朵涂涂完成签到,获得积分10
14秒前
15秒前
15秒前
严究生发布了新的文献求助10
15秒前
16秒前
17秒前
西瓜以亦完成签到 ,获得积分10
17秒前
zlfan2197发布了新的文献求助10
18秒前
白了个白完成签到,获得积分10
20秒前
停云霭霭发布了新的文献求助10
21秒前
22秒前
Ella发布了新的文献求助10
22秒前
白了个白发布了新的文献求助10
23秒前
ii完成签到 ,获得积分10
23秒前
西红柿炒番茄应助白问寒采纳,获得10
25秒前
小二郎应助Cynthia.Z采纳,获得10
25秒前
27秒前
彩虹发布了新的文献求助10
30秒前
30秒前
西红柿炒番茄应助123采纳,获得10
30秒前
32秒前
持之以恒完成签到,获得积分20
32秒前
32秒前
33秒前
Mike001发布了新的文献求助10
34秒前
严究生完成签到,获得积分10
35秒前
Mike001发布了新的文献求助30
35秒前
Mike001发布了新的文献求助30
37秒前
Orange应助无名之辈采纳,获得10
37秒前
Mike001发布了新的文献求助10
38秒前
与你发布了新的文献求助10
38秒前
高分求助中
Manual of Clinical Microbiology, 4 Volume Set (ASM Books) 13th Edition 1000
Sport in der Antike 800
De arte gymnastica. The art of gymnastics 600
Berns Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
Stephen R. Mackinnon - Chen Hansheng: China’s Last Romantic Revolutionary (2023) 500
Sport in der Antike Hardcover – March 1, 2015 500
Boris Pesce - Gli impiegati della Fiat dal 1955 al 1999 un percorso nella memoria 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2423122
求助须知:如何正确求助?哪些是违规求助? 2111976
关于积分的说明 5347740
捐赠科研通 1839460
什么是DOI,文献DOI怎么找? 915665
版权声明 561258
科研通“疑难数据库(出版商)”最低求助积分说明 489747