亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Multimodal Commonsense Knowledge Distillation for Visual Question Answering

答疑 常识 常识推理 蒸馏 计算机科学 人工智能 自然语言处理 知识抽取 化学 色谱法
作者
Shuo Yang,Siwen Luo,Soyeon Caren Han
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2411.02722
摘要

Existing Multimodal Large Language Models (MLLMs) and Visual Language Pretrained Models (VLPMs) have shown remarkable performances in the general Visual Question Answering (VQA). However, these models struggle with VQA questions that require external commonsense knowledge due to the challenges in generating high-quality prompts and the high computational costs of fine-tuning. In this work, we propose a novel graph-based multimodal commonsense knowledge distillation framework that constructs a unified relational graph over commonsense knowledge, visual objects and questions through a Graph Convolutional Network (GCN) following a teacher-student environment. This proposed framework is flexible with any type of teacher and student models without further fine-tuning, and has achieved competitive performances on the ScienceQA dataset.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
小琦笨蛋发布了新的文献求助10
1秒前
天天快乐应助科研学徒采纳,获得10
3秒前
4秒前
9秒前
9秒前
灵巧山菡发布了新的文献求助10
14秒前
科研通AI2S应助科研通管家采纳,获得10
14秒前
上官若男应助科研通管家采纳,获得10
14秒前
15秒前
wanci应助bybyby采纳,获得10
16秒前
归海听荷发布了新的文献求助10
22秒前
23秒前
狸宝的小果子完成签到 ,获得积分10
24秒前
Parotodus完成签到 ,获得积分10
25秒前
28秒前
所所应助shanghe采纳,获得10
32秒前
思源应助corEEgg采纳,获得10
40秒前
尹汉通关注了科研通微信公众号
40秒前
灵巧山菡完成签到,获得积分20
44秒前
科研通AI5应助醉熏的破茧采纳,获得10
45秒前
47秒前
尹汉通发布了新的文献求助10
51秒前
可靠从云完成签到 ,获得积分10
51秒前
ymr完成签到 ,获得积分10
52秒前
56秒前
58秒前
找文献完成签到 ,获得积分10
1分钟前
哈鲁完成签到,获得积分10
1分钟前
1分钟前
julia发布了新的文献求助10
1分钟前
1分钟前
1分钟前
绝对草草完成签到,获得积分10
1分钟前
fiona完成签到,获得积分10
1分钟前
1分钟前
哈鲁发布了新的文献求助10
1分钟前
研友_VZG7GZ应助小琦笨蛋采纳,获得10
1分钟前
gincle完成签到 ,获得积分10
1分钟前
李大白完成签到 ,获得积分10
1分钟前
柯语雪完成签到 ,获得积分10
1分钟前
高分求助中
Les Mantodea de Guyane: Insecta, Polyneoptera [The Mantids of French Guiana] 2500
The Mother of All Tableaux Order, Equivalence, and Geometry in the Large-scale Structure of Optimality Theory 1370
Future Approaches to Electrochemical Sensing of Neurotransmitters 1000
生物降解型栓塞微球市场(按产品类型、应用和最终用户)- 2030 年全球预测 1000
壮语核心名词的语言地图及解释 900
Digital predistortion of memory polynomial systems using direct and indirect learning architectures 500
Canon of Insolation and the Ice-age Problem 380
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 物理 内科学 计算机科学 纳米技术 复合材料 化学工程 遗传学 基因 物理化学 催化作用 光电子学 量子力学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 3916561
求助须知:如何正确求助?哪些是违规求助? 3462008
关于积分的说明 10920329
捐赠科研通 3189405
什么是DOI,文献DOI怎么找? 1762970
邀请新用户注册赠送积分活动 853194
科研通“疑难数据库(出版商)”最低求助积分说明 793732