Aligning Large Multimodal Models with Factually Augmented RLHF

计算机科学 模式 幻觉 水准点(测量) 人工智能 编码(集合论) 背景(考古学) 任务(项目管理) 光学(聚焦) 基本事实 强化学习 机器学习 语言模型 计算机视觉 经济 集合(抽象数据类型) 生物 管理 大地测量学 程序设计语言 地理 古生物学 社会学 社会科学 物理 光学
作者
Zhiqing Sun,Sheng Shen,Shengcao Cao,Haotian Liu,Chunyuan Li,Yikang Shen,Chuang Gan,Liang-Yan Gui,Yu-Xiong Wang,Yiming Yang,Kurt Keutzer,Trevor Darrell
出处
期刊:Cornell University - arXiv 被引量:11
标识
DOI:10.48550/arxiv.2309.14525
摘要

Large Multimodal Models (LMM) are built across modalities and the misalignment between two modalities can result in "hallucination", generating textual outputs that are not grounded by the multimodal information in context. To address the multimodal misalignment issue, we adapt the Reinforcement Learning from Human Feedback (RLHF) from the text domain to the task of vision-language alignment, where human annotators are asked to compare two responses and pinpoint the more hallucinated one, and the vision-language model is trained to maximize the simulated human rewards. We propose a new alignment algorithm called Factually Augmented RLHF that augments the reward model with additional factual information such as image captions and ground-truth multi-choice options, which alleviates the reward hacking phenomenon in RLHF and further improves the performance. We also enhance the GPT-4-generated training data (for vision instruction tuning) with previously available human-written image-text pairs to improve the general capabilities of our model. To evaluate the proposed approach in real-world scenarios, we develop a new evaluation benchmark MMHAL-BENCH with a special focus on penalizing hallucinations. As the first LMM trained with RLHF, our approach achieves remarkable improvement on the LLaVA-Bench dataset with the 94% performance level of the text-only GPT-4 (while previous best methods can only achieve the 87% level), and an improvement by 60% on MMHAL-BENCH over other baselines. We opensource our code, model, data at https://llava-rlhf.github.io.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
冷艳的小懒虫完成签到 ,获得积分10
刚刚
1秒前
清新的宛丝完成签到,获得积分10
1秒前
1秒前
MarcoPolo发布了新的文献求助10
2秒前
Jasper应助1609028采纳,获得10
2秒前
SophiaMX发布了新的文献求助10
2秒前
xl8530完成签到,获得积分10
3秒前
桃天天发布了新的文献求助10
3秒前
3秒前
利物浦2024发布了新的文献求助10
4秒前
青竹妈妈完成签到,获得积分10
5秒前
5秒前
5秒前
希望天下0贩的0应助mickle采纳,获得10
6秒前
6秒前
英俊的铭应助迷人的芹菜采纳,获得10
7秒前
8秒前
Ava应助桃天天采纳,获得10
9秒前
田様应助利物浦2024采纳,获得10
9秒前
哭泣的丝发布了新的文献求助10
9秒前
义气玫瑰完成签到,获得积分10
9秒前
共享精神应助浮浮世世采纳,获得10
10秒前
南岸娜娜完成签到 ,获得积分10
10秒前
Laity完成签到,获得积分10
12秒前
Fiee发布了新的文献求助30
13秒前
chentao发布了新的文献求助10
14秒前
14秒前
15秒前
15秒前
16秒前
17秒前
17秒前
ding应助奥利奥爱好者采纳,获得10
19秒前
20秒前
Ahua发布了新的文献求助30
21秒前
21秒前
Akim应助菜青虫采纳,获得10
21秒前
科研通AI6应助YCleeeee采纳,获得10
21秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Constitutional and Administrative Law 1000
Synthesis and properties of compounds of the type A (III) B2 (VI) X4 (VI), A (III) B4 (V) X7 (VI), and A3 (III) B4 (V) X9 (VI) 500
Microbially Influenced Corrosion of Materials 500
Die Fliegen der Palaearktischen Region. Familie 64 g: Larvaevorinae (Tachininae). 1975 500
The Experimental Biology of Bryophytes 500
The YWCA in China The Making of a Chinese Christian Women’s Institution, 1899–1957 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5394197
求助须知:如何正确求助?哪些是违规求助? 4515443
关于积分的说明 14054147
捐赠科研通 4426698
什么是DOI,文献DOI怎么找? 2431463
邀请新用户注册赠送积分活动 1423587
关于科研通互助平台的介绍 1402559