Framing reinforcement learning from human reward: Reward positivity, temporal discounting, episodicity, and performance

强化学习 贴现 认知心理学 教练 心理学 任务(项目管理) 时差学习 奖励制度 人工智能 计算机科学 神经科学 管理 财务 经济 程序设计语言
作者
W. Bradley Knox,Peter Stone
出处
期刊:Artificial Intelligence [Elsevier BV]
卷期号:225: 24-50 被引量:66
标识
DOI:10.1016/j.artint.2015.03.009

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
叶子完成签到,获得积分10
2秒前
2秒前
Papillon发布了新的文献求助10
2秒前
城城完成签到 ,获得积分10
3秒前
多边形完成签到 ,获得积分10
4秒前
铭名洺完成签到 ,获得积分10
5秒前
Owen应助wei1390采纳,获得10
6秒前
木木SCI完成签到 ,获得积分10
7秒前
颇黎完成签到,获得积分10
8秒前
9秒前
眼睛大的电脑完成签到 ,获得积分10
10秒前
11秒前
fighting完成签到,获得积分10
12秒前
power完成签到,获得积分10
12秒前
卜哥完成签到,获得积分10
12秒前
ywjkeyantong完成签到,获得积分10
13秒前
直率的宛海完成签到,获得积分10
14秒前
科研通AI2S应助荣冥幽采纳,获得10
16秒前
孟伟发布了新的文献求助10
16秒前
金木发布了新的文献求助10
17秒前
大紫罗兰馒头完成签到 ,获得积分10
18秒前
20秒前
20秒前
argon完成签到,获得积分10
22秒前
满意代萱完成签到 ,获得积分10
24秒前
马哥二弟无敌完成签到 ,获得积分10
24秒前
谢大喵完成签到 ,获得积分10
24秒前
孟伟完成签到,获得积分10
25秒前
溜了溜了发布了新的文献求助10
25秒前
Papillon完成签到,获得积分10
29秒前
阿北完成签到,获得积分10
30秒前
LegendThree完成签到,获得积分10
30秒前
31秒前
Aile。完成签到,获得积分10
35秒前
荣冥幽完成签到,获得积分10
35秒前
shang发布了新的文献求助10
36秒前
夜行完成签到,获得积分10
36秒前
卡农完成签到,获得积分10
36秒前
田様应助shengyou采纳,获得10
37秒前
学术老6完成签到,获得积分10
38秒前
高分求助中
Applied Survey Data Analysis (第三版, 2025) 800
Narcissistic Personality Disorder 700
Assessing and Diagnosing Young Children with Neurodevelopmental Disorders (2nd Edition) 700
The Elgar Companion to Consumer Behaviour and the Sustainable Development Goals 540
The Martian climate revisited: atmosphere and environment of a desert planet 500
Images that translate 500
Transnational East Asian Studies 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3843340
求助须知:如何正确求助?哪些是违规求助? 3385634
关于积分的说明 10541427
捐赠科研通 3106276
什么是DOI,文献DOI怎么找? 1710911
邀请新用户注册赠送积分活动 823851
科研通“疑难数据库(出版商)”最低求助积分说明 774313