| 标题 |
Trust Region Policy Optimization 信任区域策略优化
相关领域
超参数
单调函数
信任域
多样性(控制论)
方案(数学)
非线性系统
计算机科学
数学优化
人工神经网络
深层神经网络
人工智能
强化学习
优化算法
数学
数学分析
物理
量子力学
半径
计算机安全
|
| 网址 | |
| DOI | |
| 其它 |
期刊:arXiv (Cornell University) 作者:John Schulman; Sergey Levine; Pieter Abbeel; Michael I. Jordan; Philipp Moritz 出版日期:2015-02-19 |
| 求助人 | |
| 下载 | 暂无链接,等待应助者上传 |
|
温馨提示:该文献已被科研通 学术中心 收录,前往查看
科研通『学术中心』是文献索引库,收集文献的基本信息(如标题、摘要、期刊、作者、被引量等),不提供下载功能。如需下载文献全文,请通过文献求助获取。
|
科研通AI2.0
机器人 未找到该文献,机器人已退出,请等待人工下载
17:10:35 未找到该文献,机器人已退出,请等待人工下载17:10:33 科研通AI机器人(北京)收到请求,开始寻找文献17:10:32 已向机器人发送请求
shazhude478
Lv11 求助人 发起了本次求助