Reward prediction errors, not sensory prediction errors, play a major role in model selection in human reinforcement learning

已完结

文献求助详情

标题	Reward prediction errors, not sensory prediction errors, play a major role in model selection in human reinforcement learning 在人类强化学习模型选择中起主要作用的是奖励预测误差，而不是感觉预测误差相关领域强化学习计算机科学人工智能机器学习任务（项目管理）马尔可夫决策过程选择（遗传算法）贝叶斯概率过程（计算）均方预测误差贝叶斯推理马尔可夫过程数学统计操作系统经济管理
网址	https://doi.org/10.1016/j.neunet.2022.07.002
DOI	10.1016/j.neunet.2022.07.002 doi
其它	期刊：Neural networks 作者：Yihao Wu; Masahiko Morita; Jun Izawa 出版日期：2022-10-01
求助人	王小鱼在 2024-05-12 11:35:55 发布自山东，悬赏 10 积分
下载	该求助完结已超 24 小时，文件已从服务器自动删除，无法下载。
	温馨提示：该文献已被科研通学术中心收录，前往查看科研通『学术中心』是文献索引库，收集文献的基本信息（如标题、摘要、期刊、作者、被引量等），不提供下载功能。如需下载文献全文，请通过文献求助获取。

上个求助

下个求助

该求助已完结，感谢关注

如需该文献，请重新发布求助，前往发布

科研通，让科研之路畅通无阻

请遵守相关知识产权规定，勿将文件分享给他人，仅可用于个人研究学习

我的文献求助列表浏览历史

一分钟了解求助规则 | 捐赠本站 | 论文查重

更新

大幅提高文件上传限制，最高150M (2024-4-1)

更新

新增期刊收藏功能 (2024-03-23)

科研通是完全免费的文献互助平台，具备全网最快的应助速度，最高的求助完成率。对每一个文献求助，科研通都将尽心尽力，给求助人一个满意的交代。

实时播报: 草木完成签到，获得积分10

4秒前; 英俊的铭上传了应助文件

8秒前; imicoo发布了新的文献求助10

12秒前; Sandy完成签到，获得积分10

31秒前; wanci的应助被虚心的笑槐采纳，获得20

35秒前; 隐形曼青的应助被嗯哼采纳，获得10

39秒前; 科研剧中人完成签到，获得积分10

1分钟前; 温寒凡完成签到，获得积分10

1分钟前; CATH完成签到，获得积分10

1分钟前; morena上传了应助文件

1分钟前; 李健上传了应助文件

1分钟前; Hickey发布了新的文献求助10

1分钟前; 海子完成签到，获得积分10

2分钟前; bkagyin的应助被Vivian采纳，获得10

2分钟前; wanci上传了应助文件

2分钟前; 虚心的笑槐完成签到，获得积分10

2分钟前; 隐形曼青上传了应助文件

2分钟前; 虚心的笑槐发布了新的文献求助20

2分钟前; 英俊的铭的应助被Hickey采纳，获得10

2分钟前; 嗯哼发布了新的文献求助10

2分钟前; 科研通AI2S的应助被konstantino采纳，获得10

2分钟前; 超疏水小分队发布了新的文献求助10

2分钟前; morena上传了应助文件

2分钟前; veggieg关闭了veggieg的文献求助

3分钟前; bkagyin上传了应助文件

3分钟前; Vivian发布了新的文献求助10

3分钟前; 坚强的广山上传了应助文件

3分钟前; 可爱的函函的应助被zzx采纳，获得30

3分钟前; morena上传了应助文件

3分钟前; 可爱的函函上传了应助文件

3分钟前; 上官若男的应助被清萍红檀采纳，获得10

3分钟前; 尹冰之完成签到，获得积分10

4分钟前; 自由的梦露完成签到，获得积分10

4分钟前; 上官若男上传了应助文件

4分钟前; Vivian完成签到，获得积分10

4分钟前; morena上传了应助文件

4分钟前; 田様的应助被冰冰宝采纳，获得10

4分钟前; 清萍红檀发布了新的文献求助10

4分钟前; SciGPT的应助被张铭杰采纳，获得10

4分钟前; 田様上传了应助文件

4分钟前