A Survey of Reinforcement Learning from Human Feedback

强化学习 适应性 透视图(图形) 功能(生物学) 交叉口(航空) 计算机科学 领域(数学) 人机交互 人工智能 数据科学 认知科学 知识管理 心理学 工程类 管理 进化生物学 数学 生物 航空航天工程 经济 纯数学
作者
Timo Kaufmann,Paul Weng,Viktor Bengs,Eyke Hüllermeier
出处
期刊:Cornell University - arXiv 被引量:32
标识
DOI:10.48550/arxiv.2312.14925
摘要

Reinforcement learning from human feedback (RLHF) is a variant of reinforcement learning (RL) that learns from human feedback instead of relying on an engineered reward function. Building on prior work on the related setting of preference-based reinforcement learning (PbRL), it stands at the intersection of artificial intelligence and human-computer interaction. This positioning offers a promising avenue to enhance the performance and adaptability of intelligent systems while also improving the alignment of their objectives with human values. The training of large language models (LLMs) has impressively demonstrated this potential in recent years, where RLHF played a decisive role in directing the model's capabilities toward human objectives. This article provides a comprehensive overview of the fundamentals of RLHF, exploring the intricate dynamics between RL agents and human input. While recent focus has been on RLHF for LLMs, our survey adopts a broader perspective, examining the diverse applications and wide-ranging impact of the technique. We delve into the core principles that underpin RLHF, shedding light on the symbiotic relationship between algorithms and human feedback, and discuss the main research trends in the field. By synthesizing the current landscape of RLHF research, this article aims to provide researchers as well as practitioners with a comprehensive understanding of this rapidly growing field of research.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
王静姝完成签到,获得积分10
2秒前
小安应助科研通管家采纳,获得10
2秒前
乐乐应助科研通管家采纳,获得10
2秒前
3秒前
3秒前
无花果应助科研通管家采纳,获得10
3秒前
852应助科研通管家采纳,获得10
3秒前
充电宝应助科研通管家采纳,获得10
3秒前
iNk应助科研通管家采纳,获得20
3秒前
Ava应助科研通管家采纳,获得10
3秒前
斯文败类应助科研通管家采纳,获得10
3秒前
3秒前
3秒前
思源应助科研通管家采纳,获得10
3秒前
大个应助科研通管家采纳,获得10
3秒前
3秒前
寒冰永不腐朽完成签到,获得积分10
3秒前
小蘑菇应助科研通管家采纳,获得10
3秒前
华仔应助科研通管家采纳,获得10
4秒前
orixero应助科研通管家采纳,获得10
4秒前
molihuakai应助科研通管家采纳,获得10
4秒前
4秒前
4秒前
小马甲应助科研通管家采纳,获得30
4秒前
4秒前
科研通AI2S应助科研通管家采纳,获得10
4秒前
可爱的微笑完成签到,获得积分10
4秒前
小安应助科研通管家采纳,获得10
4秒前
科研通AI2S应助科研通管家采纳,获得10
4秒前
酷波er应助科研通管家采纳,获得10
4秒前
无花果应助科研通管家采纳,获得10
4秒前
5秒前
思源应助科研通管家采纳,获得10
5秒前
小安应助科研通管家采纳,获得10
5秒前
唐帆完成签到,获得积分20
5秒前
大时钟应助科研通管家采纳,获得10
5秒前
xiaolizi完成签到,获得积分0
5秒前
直率的鸿完成签到,获得积分10
5秒前
聪明的芝发布了新的文献求助10
6秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Development Across Adulthood 800
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
The formation of Australian attitudes towards China, 1918-1941 640
Signals, Systems, and Signal Processing 610
天津市智库成果选编 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6444891
求助须知:如何正确求助?哪些是违规求助? 8258720
关于积分的说明 17592459
捐赠科研通 5504695
什么是DOI,文献DOI怎么找? 2901611
邀请新用户注册赠送积分活动 1878590
关于科研通互助平台的介绍 1718245