标题 |
Reward prediction errors, not sensory prediction errors, play a major role in model selection in human reinforcement learning
在人类强化学习模型选择中起主要作用的是奖励预测误差,而不是感觉预测误差
相关领域
强化学习
计算机科学
人工智能
机器学习
任务(项目管理)
马尔可夫决策过程
选择(遗传算法)
贝叶斯概率
过程(计算)
均方预测误差
贝叶斯推理
马尔可夫过程
数学
统计
操作系统
经济
管理
|
网址 | |
DOI | |
其它 |
期刊:Neural networks 作者:Yihao Wu; Masahiko Morita; Jun Izawa 出版日期:2022-10-01 |
求助人 | |
下载 | 该求助完结已超 24 小时,文件已从服务器自动删除,无法下载。 |
温馨提示:该文献已被科研通 学术中心 收录,前往查看
科研通『学术中心』是文献索引库,收集文献的基本信息(如标题、摘要、期刊、作者、被引量等),不提供下载功能。如需下载文献全文,请通过文献求助获取。
|