Scenic4RL: Programmatic Modeling and Generation of Reinforcement Learning Environments

水准点(测量) 强化学习 计算机科学 集合(抽象数据类型) 空格(标点符号) 机器学习 人工智能 人机交互 程序设计语言 大地测量学 操作系统 地理
作者
Abdus Salam Azad,Edward Kim,Kimin Lee,Qiancheng Wu,Ion Stoica,Pieter Abbeel,Sanjit A. Seshia
出处
期刊:Cornell University - arXiv
摘要

The capability of reinforcement learning (RL) agent directly depends on the diversity of learning scenarios the environment generates and how closely it captures real-world situations. However, existing environments/simulators lack the support to systematically model distributions over initial states and transition dynamics. Furthermore, in complex domains such as soccer, the space of possible scenarios is infinite, which makes it impossible for one research group to provide a comprehensive set of scenarios to train, test, and benchmark RL algorithms. To address this issue, for the first time, we adopt an existing formal scenario specification language, SCENIC, to intuitively model and generate interactive scenarios. We interfaced SCENIC to Google Research Soccer environment to create a platform called SCENIC4RL. Using this platform, we provide a dataset consisting of 36 scenario programs encoded in SCENIC and demonstration data generated from a subset of them. We share our experimental results to show the effectiveness of our dataset and the platform to train, test, and benchmark RL algorithms. More importantly, we open-source our platform to enable RL community to collectively contribute to constructing a comprehensive set of scenarios.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
那种完成签到,获得积分10
1秒前
1秒前
想象之中完成签到,获得积分10
2秒前
科目三应助刘佳冉采纳,获得10
2秒前
顾矜应助复杂蚂蚁采纳,获得10
2秒前
鱼崽完成签到 ,获得积分10
2秒前
JamesPei应助lsq108采纳,获得10
2秒前
3秒前
我真服了完成签到 ,获得积分10
3秒前
千柳完成签到,获得积分10
3秒前
3秒前
呆萌的小海豚完成签到,获得积分10
3秒前
Magic发布了新的文献求助10
4秒前
YMY发布了新的文献求助10
4秒前
4秒前
Shawn完成签到,获得积分10
4秒前
椰子在长江送礼物应助ll采纳,获得10
4秒前
张张磊发布了新的文献求助10
4秒前
5秒前
5秒前
天天快乐应助YangXiao采纳,获得30
6秒前
6秒前
炙热傲菡完成签到,获得积分20
6秒前
专注的语堂完成签到,获得积分10
6秒前
颜三问发布了新的文献求助20
7秒前
7秒前
轮海完成签到,获得积分10
7秒前
zho应助lam采纳,获得10
7秒前
7秒前
科研小白发布了新的文献求助10
8秒前
1824100624发布了新的文献求助10
8秒前
8秒前
springlover完成签到,获得积分0
9秒前
荒诞DE谎言完成签到 ,获得积分10
9秒前
9秒前
研友_VZG7GZ应助XYZ采纳,获得10
9秒前
10秒前
紫色系发布了新的文献求助10
10秒前
JamesPei应助浏阳河采纳,获得30
11秒前
开放的千青完成签到,获得积分20
11秒前
高分求助中
Les Mantodea de Guyane Insecta, Polyneoptera 2500
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 (PDF!) 1000
Technologies supporting mass customization of apparel: A pilot project 450
Tip60 complex regulates eggshell formation and oviposition in the white-backed planthopper, providing effective targets for pest control 400
A Field Guide to the Amphibians and Reptiles of Madagascar - Frank Glaw and Miguel Vences - 3rd Edition 400
China Gadabouts: New Frontiers of Humanitarian Nursing, 1941–51 400
The Healthy Socialist Life in Maoist China, 1949–1980 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3789101
求助须知:如何正确求助?哪些是违规求助? 3334213
关于积分的说明 10267996
捐赠科研通 3050485
什么是DOI,文献DOI怎么找? 1674041
邀请新用户注册赠送积分活动 802435
科研通“疑难数据库(出版商)”最低求助积分说明 760607