Neural Temporal-Difference and Q-Learning Provably Converge to Global Optima

已关闭

文献求助详情

标题	Neural Temporal-Difference and Q-Learning Provably Converge to Global Optima 神经时差和Q学习可证明地收敛于全局最优相关领域时差学习人工神经网络次线性函数强化学习趋同（经济学）分歧（语言学）非线性系统贝尔曼方程计算机科学功能（生物学）增强学习全局优化数学优化数学应用数学人工智能经济物理数学分析哲学语言学生物进化生物学量子力学经济增长
网址	https://doi.org/10.48550/arxiv.1905.10027 AI链接 arxiv.org arxiv.orgdoi.org
DOI	10.48550/arxiv.1905.10027 doi
其它	期刊：Cornell University - arXiv 作者：Yongchang Liu; Zhuoran Yang; Jason T. Lee; Zhaoran Wang 出版日期：2019-05-24
求助人	苗笑卉在 2023-07-06 12:57:27 发布自山东，悬赏 10 积分
下载
	温馨提示：该文献已被科研通学术中心收录，前往查看科研通『学术中心』是文献索引库，收集文献的基本信息（如标题、摘要、期刊、作者、被引量等），不提供下载功能。如需下载文献全文，请通过文献求助获取。

Society for Industrial and Applied Mathematics (SIAM)

上个求助

求助 / 应助时间线

10个月前，求助关闭

苗笑卉求助人 Lv1 关闭了本次求助。

说明求助文献错误【积分已退回】
10个月前

苗笑卉求助人 Lv1 发起了本次求助

我的文献求助列表浏览历史

一分钟了解求助规则 | 捐赠本站 | 论文查重

更新

大幅提高文件上传限制，最高150M (2024-4-1)

更新

新增期刊收藏功能 (2024-03-23)

科研通是完全免费的文献互助平台，具备全网最快的应助速度，最高的求助完成率。对每一个文献求助，科研通都将尽心尽力，给求助人一个满意的交代。

实时播报: 小二郎的应助被科研通管家采纳，获得10

1秒前; SciGPT的应助被科研通管家采纳，获得10

1秒前; 斯文败类的应助被科研通管家采纳，获得10

1秒前; gloval的应助被科研通管家采纳，获得10

1秒前; wjw发布了新的文献求助10

3秒前; 赘婿的应助被秋秋采纳，获得10

5秒前; 研友_VZG7GZ上传了应助文件

5秒前; orixero的应助被like采纳，获得10

7秒前; 漂亮萝莉完成签到，获得积分10

9秒前; 李嘉钱发布了新的文献求助10

9秒前; 隐形曼青上传了应助文件

9秒前; 小飞飞发布了新的文献求助10

10秒前; 冷酷之卉123完成签到，获得积分10

11秒前; zhangyumin发布了新的文献求助10

12秒前; 烟花的应助被帝是天采纳，获得10

13秒前; 柠檬精翠翠发布了新的文献求助20

13秒前; 上官若男的应助被小飞飞采纳，获得10

14秒前; 赘婿上传了应助文件

17秒前; Yvonne发布了新的文献求助10

18秒前; imchenyin完成签到，获得积分10

19秒前; 云龙败走赵家峪完成签到，获得积分10

20秒前; arielice发布了新的文献求助10

20秒前; wanci的应助被天火采纳，获得10

21秒前; 坚强的广山上传了应助文件

21秒前; 李健的小迷弟上传了应助文件

22秒前; SciGPT上传了应助文件

22秒前; 秋秋发布了新的文献求助10

22秒前; 一一完成签到，获得积分0

23秒前; 送你一匹马完成签到，获得积分10

26秒前; WerWu的应助被邵锴采纳，获得10

26秒前; 虎皮猫大人发布了新的文献求助10

27秒前; senna发布了新的文献求助10

28秒前; Cindy上传了应助文件

28秒前; orixero上传了应助文件

29秒前; 可爱迪的应助被xie采纳，获得10

29秒前; arielice完成签到，获得积分10

30秒前; anannnnn关注了科研通微信公众号

31秒前; 乐乐上传了应助文件

33秒前; like发布了新的文献求助10

34秒前; 柠檬精翠翠完成签到，获得积分10

34秒前