标题 |
![]() 非策略RL算法可以是样本有效的,用于经由样本多次重用的连续控制
相关领域
超参数
计算机科学
重新使用
强化学习
样品(材料)
算法
趋同(经济学)
控制(管理)
基础(拓扑)
机器学习
人工智能
数学
化学
色谱法
生态学
数学分析
经济
生物
经济增长
|
网址 | |
DOI | |
其它 |
期刊:Information Sciences 作者:Jiafei Lyu; Le Wan; Xiu Li; Zongqing Lu 出版日期:2024-02-28 |
求助人 | |
下载 | 该求助完结已超 24 小时,文件已从服务器自动删除,无法下载。 |
温馨提示:该文献已被科研通 学术中心 收录,前往查看
科研通『学术中心』是文献索引库,收集文献的基本信息(如标题、摘要、期刊、作者、被引量等),不提供下载功能。如需下载文献全文,请通过文献求助获取。
|