PP-PG: Combining Parameter Perturbation with Policy Gradient Methods for Effective and Efficient Explorations in Deep Reinforcement Learning

已关闭

文献求助详情

标题	PP-PG: Combining Parameter Perturbation with Policy Gradient Methods for Effective and Efficient Explorations in Deep Reinforcement Learning PP-PG：将参数扰动与策略梯度方法相结合，在深度强化学习中进行有效和高效的探索相关领域强化学习计算机科学参数统计摄动（天文学）动作（物理）人口人工智能数学优化机器学习数学物理量子力学统计社会学人口学
网址	https://doi.org/10.1145/3452008
DOI	10.1145/3452008 doi
其它	期刊：ACM Transactions on Intelligent Systems and Technology 作者：Shilei Li; Meng Li; Jiongming Su; Shaofei Chen; Zhimin Yuan; et al 出版日期：2021-06-03
求助人	listener 在 2025-07-01 23:14:39 发布自浙江，悬赏 10 积分
下载
	温馨提示：该文献已被科研通学术中心收录，前往查看科研通『学术中心』是文献索引库，收集文献的基本信息（如标题、摘要、期刊、作者、被引量等），不提供下载功能。如需下载文献全文，请通过文献求助获取。

上个求助

提交工单

求助 / 应助时间线

1年前，求助关闭

listener Lv5 求助人关闭了本次求助。

说明已有有【积分已退回】
1年前

listener Lv5 求助人发起了本次求助

我的文献求助列表浏览历史

一分钟了解求助规则 | 捐赠本站 | 历史今天

更新

⚡ 2026年影响因子、分区 已更新！ (2026-6-17)

更新

📰 新增『新锐期刊分区』 (2026-3-24)

更新

💬 新增更精细的自定义提醒设置 (2026-1-4)

新增

🕒 每天60秒读懂世界·精选全球要闻 (2026-1-2)

新增

PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台，具备全网最快的应助速度，最高的求助完成率。对每一个文献求助，科研通都将尽心尽力，给求助人一个满意的交代。

实时播报: 9527上传了应助文件

1秒前; 慈祥的丹寒完成签到，获得积分10

18秒前; 忧郁思远完成签到，获得积分10

22秒前; 黄海峰完成签到，获得积分10

28秒前; 纯真完成签到，获得积分10

34秒前; 9527完成签到，获得积分10

39秒前; 狂野从蕾完成签到，获得积分10

43秒前; 乐观的雁完成签到，获得积分10

53秒前; qi完成签到，获得积分10

1分钟前; 慕青的应助被科研通管家采纳，获得10

1分钟前; 如意盼夏完成签到，获得积分10

1分钟前; 李爱国的应助被Grey采纳，获得10

1分钟前; 严采波完成签到，获得积分10

1分钟前; 李爱国上传了应助文件

1分钟前; 黎至完成签到，获得积分10

1分钟前; Grey发布了新的文献求助10

1分钟前; 酷炫的煎饼发布了新的文献求助10

2分钟前; hi完成签到，获得积分10

2分钟前; 图南发布了新的文献求助30

2分钟前; shadow完成签到，获得积分10

2分钟前; 酷炫的煎饼完成签到，获得积分10

2分钟前; fx完成签到，获得积分20

3分钟前; 科研通AI6.3的应助被科研通管家采纳，获得10

3分钟前; Copyright的应助被科研通管家采纳，获得10

3分钟前; Kao的应助被科研通管家采纳，获得10

3分钟前; 翔翔超人完成签到，获得积分10

3分钟前; 乐游发布了新的文献求助10

3分钟前; 隐形曼青的应助被开心的中心采纳，获得10

4分钟前; pinklay完成签到，获得积分10

4分钟前; CJH104完成签到，获得积分10

4分钟前; 爆米花的应助被开心的中心采纳，获得10

4分钟前; 科研通AI6.2上传了应助文件

4分钟前; 爱听歌幻完成签到，获得积分20

4分钟前; 天天快乐的应助被开心的中心采纳，获得10

4分钟前; 忍冬完成签到，获得积分10

4分钟前; 汉德萌多林发布了新的文献求助10

4分钟前; eee完成签到，获得积分10

4分钟前; Lennox发布了新的文献求助10

5分钟前; Gaolongzhen完成签到，获得积分10

5分钟前; 脑洞疼上传了应助文件

5分钟前