标题 |
![]() 发现一套最坏情况下奖励的策略
相关领域
集合(抽象数据类型)
计算机科学
强化学习
任务(项目管理)
班级(哲学)
功能(生物学)
网格
构造(python库)
订单(交换)
光学(聚焦)
单调函数
人工智能
数学
数学分析
程序设计语言
管理
经济
几何学
物理
光学
生物
进化生物学
财务
|
网址 |
AI链接 arxiv.org |
DOI |
暂未提供,该求助的时间将会延长,查看原因?
|
其它 |
期刊:arXiv (Cornell University) 作者:Tom Zahavy; Andre Noll Barreto; Daniel J. Mankowitz; Shaobo Hou; Brendan O'Donoghue; et al 出版日期:2021-05-03 |
求助人 | |
下载 | |
温馨提示:该文献已被科研通 学术中心 收录,前往查看
科研通『学术中心』是文献索引库,收集文献的基本信息(如标题、摘要、期刊、作者、被引量等),不提供下载功能。如需下载文献全文,请通过文献求助获取。
|
zongzi12138
Lv71 求助人 关闭了本次求助。
说明 已经有文献【积分已退回】
zongzi12138
Lv71 求助人 发起了本次求助