清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Discovering the Real Association: Multimodal Causal Reasoning in Video Question Answering

计算机科学 答疑 人工智能 语义学(计算机科学) 自然语言处理 稳健性(进化) 程序设计语言 生物化学 基因 化学
作者
Chuanqi Zang,Hanqing Wang,Mingtao Pei,Wei Liang
标识
DOI:10.1109/cvpr52729.2023.01824
摘要

Video Question Answering (VideoQA) is challenging as it requires capturing accurate correlations between modalities from redundant information. Recent methods focus on the explicit challenges of the task, e.g. multimodal feature extraction, video-text alignment and fusion. Their frameworks reason the answer relying on statistical evidence causes, which ignores potential bias in the multimodal data. In our work, we investigate relational structure from a causal representation perspective on multimodal data and propose a novel inference framework. For visual data, question-irrelevant objects may establish simple matching associations with the answer. For textual data, the model prefers the local phrase semantics which may deviate from the global semantics in long sentences. Therefore, to enhance the generalization of the model, we discover the real association by explicitly capturing visual features that are causally related to the question semantics and weakening the impact of local language semantics on question answering. The experimental results on two large causal VideoQA datasets verify that our proposed framework 1) improves the accuracy of the existing VideoQA backbone, 2) demonstrates robustness on complex scenes and questions. The code will be released at https://github.com/Chuanqi-Zang/Discovering-the-Real-Association.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
雷寒云发布了新的文献求助10
3秒前
LELE完成签到 ,获得积分10
5秒前
6秒前
Adam完成签到 ,获得积分10
11秒前
huangzsdy完成签到,获得积分10
18秒前
缥缈的闭月完成签到,获得积分10
24秒前
wefor完成签到 ,获得积分10
26秒前
28秒前
含糊的茹妖完成签到 ,获得积分0
29秒前
优秀的尔风完成签到,获得积分10
31秒前
雷寒云发布了新的文献求助30
32秒前
执着的以筠完成签到 ,获得积分10
33秒前
47秒前
雷寒云发布了新的文献求助10
47秒前
Glory完成签到 ,获得积分10
49秒前
qcck完成签到,获得积分10
51秒前
liaomr完成签到 ,获得积分10
51秒前
呆呆的猕猴桃完成签到 ,获得积分10
51秒前
sowhat完成签到 ,获得积分10
52秒前
1分钟前
淡定的水彤完成签到,获得积分10
1分钟前
sobergod完成签到 ,获得积分10
1分钟前
daixan89完成签到 ,获得积分10
1分钟前
Leon完成签到,获得积分0
1分钟前
寒战完成签到 ,获得积分10
1分钟前
xianyaoz完成签到 ,获得积分0
1分钟前
fanssw完成签到 ,获得积分10
1分钟前
小白兔完成签到 ,获得积分10
1分钟前
TY完成签到 ,获得积分10
1分钟前
1分钟前
JJ完成签到 ,获得积分10
1分钟前
张宁波完成签到,获得积分10
1分钟前
淞33完成签到 ,获得积分10
1分钟前
双眼皮跳蚤完成签到,获得积分10
1分钟前
不安的白昼完成签到 ,获得积分10
1分钟前
喻紫寒完成签到 ,获得积分20
2分钟前
fev123完成签到,获得积分10
2分钟前
2分钟前
2分钟前
高分求助中
Les Mantodea de Guyane Insecta, Polyneoptera 2500
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 (PDF!) 1000
Technologies supporting mass customization of apparel: A pilot project 450
A Field Guide to the Amphibians and Reptiles of Madagascar - Frank Glaw and Miguel Vences - 3rd Edition 400
China Gadabouts: New Frontiers of Humanitarian Nursing, 1941–51 400
The Healthy Socialist Life in Maoist China, 1949–1980 400
Walking a Tightrope: Memories of Wu Jieping, Personal Physician to China's Leaders 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3788347
求助须知:如何正确求助?哪些是违规求助? 3333722
关于积分的说明 10263216
捐赠科研通 3049616
什么是DOI,文献DOI怎么找? 1673639
邀请新用户注册赠送积分活动 802120
科研通“疑难数据库(出版商)”最低求助积分说明 760511