Embracing Unimodal Aleatoric Uncertainty for Robust Multimodal Fusion

计算机科学 融合 人工智能 稳健性(进化) 哲学 语言学 生物化学 基因 化学
作者
Zixian Gao,Xun Jiang,Xing Xu,Fumin Shen,Yujie Li,Heng Tao Shen
标识
DOI:10.1109/cvpr52733.2024.02538
摘要

As a fundamental problem in multimodal learning, multimodal fusion aims to compensate for the inherent limitations of a single modality. One challenge of multimodal fusion is that the unimodal data in their unique embedding space mostly contains potential noise, which leads to corrupted cross-modal interactions. However, in this paper, we show that the potential noise in unimodal data could be well quantified and further employed to enhance more stable unimodal embeddings via contrastive learning. Specifically, we propose a novel generic and robust multimodal fusion strategy, termed Embracing Aleatoric Uncertainty (EAU), which is simple and can be applied to kinds of modalities. It consists of two key steps: (1) the Stable Unimodal Feature Augmentation (SUFA) that learns a stable unimodal representation by incorporating the aleatoric uncertainty into self-supervised contrastive learning. (2) Robust Multimodal Feature Integration (RMFI) leveraging an information-theoretic strategy to learn a robust compact joint representation. We evaluate our proposed EAU method on five multimodal datasets, where the video, RGB image, text, audio, and depth image are involved. Extensive experiments demonstrate the EAU method is more noise-resistant than existing multimodal fusion strategies and establishes new state-of-the-art on several benchmarks.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
少吃一口完成签到,获得积分10
刚刚
刚刚
xuedan完成签到,获得积分10
1秒前
潇洒小蚂蚁应助执着卿采纳,获得10
5秒前
Litty完成签到,获得积分10
7秒前
哇咔咔发布了新的文献求助10
8秒前
8秒前
8秒前
8秒前
8秒前
fxw发布了新的文献求助20
8秒前
229757139发布了新的文献求助10
9秒前
9秒前
热心果汁完成签到,获得积分10
9秒前
现实的面包关注了科研通微信公众号
10秒前
DUAN发布了新的文献求助10
10秒前
任成艳完成签到,获得积分10
10秒前
深情安青应助YUEYUE采纳,获得10
11秒前
山顶洞人发布了新的文献求助10
12秒前
13秒前
13秒前
斯文败类应助英俊的裘采纳,获得10
13秒前
专注白昼发布了新的文献求助10
13秒前
Lily发布了新的文献求助10
14秒前
高大荔枝发布了新的文献求助20
16秒前
科目三应助庶民文献采纳,获得10
16秒前
现实的宝马完成签到,获得积分10
18秒前
yu发布了新的文献求助10
19秒前
顾矜应助yu采纳,获得10
20秒前
20秒前
烤肠完成签到,获得积分10
21秒前
慕青应助L_采纳,获得10
21秒前
Hello应助山顶洞人采纳,获得10
22秒前
OCT完成签到,获得积分10
22秒前
科研通AI6.3应助温衡采纳,获得10
22秒前
缓慢夜梦完成签到 ,获得积分10
23秒前
猫小乐C完成签到,获得积分10
23秒前
执着卿完成签到,获得积分10
24秒前
24秒前
专注白昼完成签到,获得积分10
25秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
A Research Agenda for Law, Finance and the Environment 800
Development Across Adulthood 800
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
A Time to Mourn, A Time to Dance: The Expression of Grief and Joy in Israelite Religion 700
The formation of Australian attitudes towards China, 1918-1941 640
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6446860
求助须知:如何正确求助?哪些是违规求助? 8260100
关于积分的说明 17597127
捐赠科研通 5508132
什么是DOI,文献DOI怎么找? 2902208
邀请新用户注册赠送积分活动 1879193
关于科研通互助平台的介绍 1719488