强化学习
路径积分公式
计算机科学
路径(计算)
控制(管理)
钢筋
数学
人工智能
数学优化
物理
心理学
量子力学
社会心理学
量子
程序设计语言
作者
TheodorouEvangelos,BuchliJonas,SchaalStefan
标识
DOI:10.5555/1756006.1953033
摘要
With the goal to generate more scalable algorithms with higher efficiency and fewer open parameters, reinforcement learning (RL) has recently moved towards combining classical techniques from optim...
科研通智能强力驱动
Strongly Powered by AbleSci AI