Overview of Reinforcement Learning Based on Value and Policy

强化学习 计算机科学 钢筋 人工智能 价值(数学) 增强学习 错误驱动学习 贝尔曼方程 机器学习 数学优化 工程类 数学 结构工程
作者
Yunting Liu,Yang Jia-ming,Liang Chen,Ting Guo,Yu Jiang
标识
DOI:10.1109/ccdc49329.2020.9164615
摘要

Reinforcement learning methods are mainly divided into two categories based on value functions and policies. This article systematically introduces and summarizes reinforcement learning methods from these two categories. First, it summarizes the reinforcement learning methods based on value functions, including classic Q-learning, DQN, and effective improvement methods based on DQN. Then it introduces policy-based reinforcement learning methods, including policy gradient, policy optimization, actor critic, and their improvements. Finally, the frontier research and applications of reinforcement learning is summarized.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
欧阳静芙完成签到,获得积分10
刚刚
1秒前
大个应助nav采纳,获得10
1秒前
不吃了完成签到 ,获得积分10
4秒前
zhaolee完成签到 ,获得积分10
5秒前
Jun发布了新的文献求助10
5秒前
应俊完成签到 ,获得积分10
9秒前
欸嘿完成签到,获得积分10
11秒前
16秒前
alexlpb完成签到,获得积分0
17秒前
烂漫人达完成签到 ,获得积分10
17秒前
17秒前
布曲完成签到 ,获得积分10
19秒前
YIFGU完成签到 ,获得积分10
19秒前
子非鱼完成签到 ,获得积分10
22秒前
qing1245发布了新的文献求助10
22秒前
27秒前
hyf完成签到 ,获得积分10
29秒前
冬菊完成签到 ,获得积分10
31秒前
33秒前
灰太狼大王完成签到 ,获得积分10
36秒前
bone完成签到,获得积分10
38秒前
Java完成签到,获得积分10
39秒前
Trouvailla发布了新的文献求助10
40秒前
克姑美完成签到 ,获得积分10
42秒前
nove999完成签到 ,获得积分10
42秒前
道友等等我完成签到,获得积分0
51秒前
Amon完成签到,获得积分10
53秒前
Hightowerliu18完成签到,获得积分10
53秒前
华仔应助科研通管家采纳,获得10
59秒前
打打应助科研通管家采纳,获得10
59秒前
FashionBoy应助科研通管家采纳,获得10
59秒前
1分钟前
crown发布了新的文献求助10
1分钟前
绿色心情发布了新的文献求助10
1分钟前
Trouvailla完成签到,获得积分10
1分钟前
迪鸣完成签到,获得积分10
1分钟前
1分钟前
ice完成签到 ,获得积分10
1分钟前
qing1245发布了新的文献求助10
1分钟前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
Maneuvering of a Damaged Navy Combatant 650
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
Mixing the elements of mass customisation 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3779296
求助须知:如何正确求助?哪些是违规求助? 3324813
关于积分的说明 10220097
捐赠科研通 3039971
什么是DOI,文献DOI怎么找? 1668528
邀请新用户注册赠送积分活动 798717
科研通“疑难数据库(出版商)”最低求助积分说明 758503