Exploration in neo-Hebbian reinforcement learning: Computational approaches to the exploration–exploitation balance with bio-inspired neural networks

赫比理论 强化学习 计算机科学 利布拉 人工智能 人工神经网络 无监督学习 机器学习 唤醒睡眠算法 泛化误差
作者
Anthony Triche,Anthony S. Maida,Ashok Kumar
出处
期刊:Neural Networks [Elsevier]
卷期号:151: 16-33 被引量:4
标识
DOI:10.1016/j.neunet.2022.03.021
摘要

Recent theoretical and experimental works have connected Hebbian plasticity with the reinforcement learning (RL) paradigm, producing a class of trial-and-error learning in artificial neural networks known as neo-Hebbian plasticity. Inspired by the role of the neuromodulator dopamine in synaptic modification, neo-Hebbian RL methods extend unsupervised Hebbian learning rules with value-based modulation to selectively reinforce associations. This reinforcement allows for learning exploitative behaviors and produces RL models with strong biological plausibility. The review begins with coverage of fundamental concepts in rate- and spike-coded models. We introduce Hebbian correlation detection as a basis for modification of synaptic weighting and progress to neo-Hebbian RL models guided solely by extrinsic rewards. We then analyze state-of-the-art neo-Hebbian approaches to the exploration-exploitation balance under the RL paradigm, emphasizing works that employ additional mechanics to modulate that dynamic. Our review of neo-Hebbian RL methods in this context indicates substantial potential for novel improvements in exploratory learning, primarily through stronger incorporation of intrinsic motivators. We provide a number of research suggestions for this pursuit by drawing from modern theories and results in neuroscience and psychology. The exploration-exploitation balance is a central issue in RL research, and this review is the first to focus on it under the neo-Hebbian RL framework.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
3秒前
3秒前
Simone完成签到,获得积分20
5秒前
彳亍1117应助ramsdale采纳,获得10
5秒前
Kim发布了新的文献求助10
6秒前
郑鹏飞发布了新的文献求助10
7秒前
外向蜡烛完成签到,获得积分10
10秒前
Kim完成签到,获得积分10
12秒前
壳米应助郑鹏飞采纳,获得10
14秒前
16秒前
科目三应助东拉西扯采纳,获得10
17秒前
18秒前
18秒前
星辰大海应助ramsdale采纳,获得10
18秒前
DayFu发布了新的文献求助20
21秒前
羊羊关注了科研通微信公众号
23秒前
nini发布了新的文献求助10
23秒前
美丽的含羞草完成签到,获得积分20
23秒前
丰丰扫心完成签到,获得积分10
25秒前
26秒前
zc完成签到,获得积分10
27秒前
妙松完成签到,获得积分10
27秒前
xiaoxia完成签到,获得积分10
29秒前
张中阳发布了新的文献求助10
30秒前
31秒前
sxwang完成签到,获得积分10
32秒前
36秒前
38秒前
39秒前
41秒前
林慧凡完成签到,获得积分10
42秒前
hyq26发布了新的文献求助10
43秒前
43秒前
fancy发布了新的文献求助10
43秒前
Kyo发布了新的文献求助10
44秒前
44秒前
46秒前
nini完成签到,获得积分20
46秒前
viauue9发布了新的文献求助10
47秒前
48秒前
高分求助中
Un calendrier babylonien des travaux, des signes et des mois: Séries iqqur îpuš 1036
Quantum Science and Technology Volume 5 Number 4, October 2020 1000
Formgebungs- und Stabilisierungsparameter für das Konstruktionsverfahren der FiDU-Freien Innendruckumformung von Blech 1000
IG Farbenindustrie AG and Imperial Chemical Industries Limited strategies for growth and survival 1925-1953 800
Sustainable Land Management: Strategies to Cope with the Marginalisation of Agriculture 600
Prochinois Et Maoïsmes En France (et Dans Les Espaces Francophones) 500
Beyond Transnationalism: Mapping the Spatial Contours of Political Activism in Europe’s Long 1970s 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2520460
求助须知:如何正确求助?哪些是违规求助? 2164056
关于积分的说明 5547664
捐赠科研通 1884183
什么是DOI,文献DOI怎么找? 938064
版权声明 564482
科研通“疑难数据库(出版商)”最低求助积分说明 500554