Pre-gating and contextual attention gate — A new fusion method for multi-modal data tasks

情态动词 代表(政治) 计算机科学 人工智能 门控 特征(语言学) 财产(哲学) 特征学习 模式识别(心理学) 机器学习 生物 政治 认识论 哲学 化学 高分子化学 生理学 法学 语言学 政治学
作者
Duoyi Zhang,Richi Nayak,Md Abul Bashar
出处
期刊:Neural Networks [Elsevier BV]
卷期号:179: 106553-106553 被引量:15
标识
DOI:10.1016/j.neunet.2024.106553
摘要

Multi-modal representation learning has received significant attention across diverse research domains due to its ability to model a scenario comprehensively. Learning the cross-modal interactions is essential to combining multi-modal data into a joint representation. However, conventional cross-attention mechanisms can produce noisy and non-meaningful values in the absence of useful cross-modal interactions among input features, thereby introducing uncertainty into the feature representation. These factors have the potential to degrade the performance of downstream tasks. This paper introduces a novel Pre-gating and Contextual Attention Gate (PCAG) module for multi-modal learning comprising two gating mechanisms that operate at distinct information processing levels within the deep learning model. The first gate filters out interactions that lack informativeness for the downstream task, while the second gate reduces the uncertainty introduced by the cross-attention module. Experimental results on eight multi-modal classification tasks spanning various domains show that the multi-modal fusion model with PCAG outperforms state-of-the-art multi-modal fusion models. Additionally, we elucidate how PCAG effectively processes cross-modality interactions.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
予三千笔墨完成签到 ,获得积分10
刚刚
2075发布了新的文献求助10
刚刚
YANG发布了新的文献求助20
刚刚
小鱼完成签到,获得积分10
1秒前
hjhhjh完成签到,获得积分10
1秒前
郭可梦完成签到 ,获得积分10
2秒前
甜甜绮烟完成签到 ,获得积分10
2秒前
2秒前
英俊的铭应助xnz采纳,获得10
3秒前
wanmiao12完成签到,获得积分10
4秒前
小巧的白竹完成签到,获得积分10
4秒前
义气萝卜头完成签到 ,获得积分10
4秒前
宋瓜完成签到,获得积分10
4秒前
牛角包完成签到,获得积分10
4秒前
lidan_2008完成签到,获得积分10
5秒前
风趣的念薇完成签到,获得积分10
6秒前
狂踹瘸子内条好腿完成签到,获得积分10
6秒前
8秒前
端庄的火龙果完成签到,获得积分10
8秒前
2075完成签到,获得积分10
8秒前
8秒前
shy完成签到,获得积分10
8秒前
吉拉拉完成签到,获得积分10
8秒前
ZJL完成签到,获得积分10
8秒前
温文儒雅鳗鱼冻完成签到,获得积分10
8秒前
爱落红尘完成签到,获得积分10
9秒前
9秒前
和谐的鲂关注了科研通微信公众号
9秒前
杨瑞东完成签到,获得积分10
10秒前
10秒前
成就的大米完成签到,获得积分10
10秒前
会飞的猪发布了新的文献求助10
11秒前
tangzanwayne完成签到,获得积分10
12秒前
zyy完成签到,获得积分10
12秒前
老福贵儿应助zhouwenbiao采纳,获得10
12秒前
111完成签到 ,获得积分20
13秒前
皛宁发布了新的文献求助10
13秒前
banqia完成签到,获得积分10
13秒前
batchbio完成签到,获得积分10
13秒前
Month发布了新的文献求助10
14秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Organometallic Chemistry of the Transition Metals 800
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
Leading Academic-Practice Partnerships in Nursing and Healthcare: A Paradigm for Change 800
The formation of Australian attitudes towards China, 1918-1941 640
Signals, Systems, and Signal Processing 610
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6436739
求助须知:如何正确求助?哪些是违规求助? 8251249
关于积分的说明 17552650
捐赠科研通 5495152
什么是DOI,文献DOI怎么找? 2898233
邀请新用户注册赠送积分活动 1875008
关于科研通互助平台的介绍 1716197