| 标题 |
PP-PG: Combining Parameter Perturbation with Policy Gradient Methods for Effective and Efficient Explorations in Deep Reinforcement Learning PP-PG:将参数扰动与策略梯度方法相结合,在深度强化学习中进行有效和高效的探索
相关领域
强化学习
计算机科学
参数统计
摄动(天文学)
动作(物理)
人口
人工智能
数学优化
机器学习
数学
物理
统计
人口学
量子力学
社会学
|
| 网址 | |
| DOI | |
| 其它 |
期刊:ACM Transactions on Intelligent Systems and Technology 作者:Shilei Li; Meng Li; Jiongming Su; Shaofei Chen; Zhimin Yuan; et al 出版日期:2021-06-03 |
| 求助人 | |
| 下载 | |
|
温馨提示:该文献已被科研通 学术中心 收录,前往查看
科研通『学术中心』是文献索引库,收集文献的基本信息(如标题、摘要、期刊、作者、被引量等),不提供下载功能。如需下载文献全文,请通过文献求助获取。
|