Off-policy RL algorithms can be sample-efficient for continuous control via sample multiple reuse

已完结

文献求助详情

标题	Off-policy RL algorithms can be sample-efficient for continuous control via sample multiple reuse 非策略RL算法可以是样本有效的，用于经由样本多次重用的连续控制相关领域超参数计算机科学重新使用强化学习样品（材料）算法趋同（经济学）控制（管理）基础（拓扑）机器学习人工智能数学化学色谱法生态学数学分析经济生物经济增长
网址	https://doi.org/10.1016/j.ins.2024.120371
DOI	10.1016/j.ins.2024.120371 doi
其它	期刊：Information Sciences 作者：Jiafei Lyu; Le Wan; Xiu Li; Zongqing Lu 出版日期：2024-02-28
求助人	冬雪在 2025-03-14 16:24:34 发布自辽宁，悬赏 10 积分
下载	该求助完结已超 24 小时，文件已从服务器自动删除，无法下载。
	温馨提示：该文献已被科研通学术中心收录，前往查看科研通『学术中心』是文献索引库，收集文献的基本信息（如标题、摘要、期刊、作者、被引量等），不提供下载功能。如需下载文献全文，请通过文献求助获取。

上个求助

下个求助

该求助已完结，感谢关注

如需该文献，请重新发布求助，前往发布

有了科研通，下载文献真轻松！

请遵守相关知识产权规定，勿将文件分享给他人，仅可用于个人研究学习

我的文献求助列表浏览历史

一分钟了解求助规则 | 捐赠本站 | 历史今天

活动

『应助活动周』获奖名单已公布 🔥 (2025-4-2)

更新

『中科院2025期刊分区』已更新 (2025-3-23)

更新

『即时热点』模块已上线 (2025-2-28)

科研通是完全免费的文献互助平台，具备全网最快的应助速度，最高的求助完成率。对每一个文献求助，科研通都将尽心尽力，给求助人一个满意的交代。

实时播报: 平安喜乐发布了新的文献求助10

1秒前; 斯文败类上传了应助文件

1秒前; 咩咩咩完成签到，获得积分20

2秒前; 颜色发布了新的文献求助10

4秒前; 酷波er的应助被YOY采纳，获得10

4秒前; bkagyin的应助被务实的犀牛采纳，获得10

7秒前; 乐观的忘幽完成签到，获得积分10

7秒前; Owen的应助被Hzyaccept采纳，获得10

7秒前; 咩咩咩发布了新的文献求助30

7秒前; 求知小生完成签到，获得积分10

10秒前; 小马甲上传了应助文件

11秒前; 深情安青上传了应助文件

11秒前; 七里香完成签到，获得积分10

15秒前; 科研通AI5上传了应助文件

15秒前; 邓娇叶发布了新的文献求助10

16秒前; 龙梦发布了新的文献求助10

17秒前; 陶醉寒珊驳回了爆米花的应助

17秒前; CDQ完成签到，获得积分10

17秒前; zstyry9998发布了新的文献求助10

20秒前; 寒生发布了新的文献求助10

20秒前; 打打上传了应助文件

23秒前; 科研通AI2S上传了应助文件

25秒前; 科研通AI5上传了应助文件

25秒前; L_etoile完成签到，获得积分10

26秒前; 李爱国的应助被龙梦采纳，获得10

26秒前; FashionBoy上传了应助文件

28秒前; fatcat发布了新的文献求助30

28秒前; zstyry9998完成签到，获得积分10

28秒前; 高兴的小完成签到，获得积分10

29秒前; yueyue完成签到，获得积分20

31秒前; 石金胜发布了新的文献求助10

31秒前; 君君上传了应助文件

31秒前; echo完成签到，获得积分10

33秒前; 无奈的代珊完成签到，获得积分10

34秒前; jolin发布了新的文献求助10

34秒前; 猪猪hero的应助被科研通管家采纳，获得10

34秒前; 完美世界的应助被科研通管家采纳，获得10

34秒前; 小二郎的应助被科研通管家采纳，获得10

34秒前; NexusExplorer的应助被科研通管家采纳，获得10

34秒前; 香蕉觅云的应助被科研通管家采纳，获得10

35秒前