强化学习
贝尔曼方程
功能(生物学)
函数逼近
可微函数
数学优化
价值(数学)
计算机科学
应用数学
数学
人工智能
人工神经网络
机器学习
数学分析
进化生物学
生物
作者
Richard S. Sutton,David McAllester,Satinder Singh,Yishay Mansour
出处
期刊:Neural Information Processing Systems
日期:1999-11-29
卷期号:12: 1057-1063
被引量:4950
摘要
Function approximation is essential to reinforcement learning, but the standard approach of approximating a value function and determining a policy from it has so far proven theoretically intractable. In this paper
科研通智能强力驱动
Strongly Powered by AbleSci AI