ICAFusion: Iterative cross-attention guided feature fusion for multispectral object detection

计算机科学 多光谱图像 人工智能 特征(语言学) 目标检测 模式识别(心理学) 迭代和增量开发 特征提取 语言学 软件工程 哲学
作者
Jifeng Shen,Yifei Chen,Yue Liu,Xin Zuo,Heng Fan,Wankou Yang
出处
期刊:Pattern Recognition [Elsevier BV]
卷期号:145: 109913-109913 被引量:76
标识
DOI:10.1016/j.patcog.2023.109913
摘要

Effective feature fusion of multispectral images plays a crucial role in multispectral object detection. Previous studies have demonstrated the effectiveness of feature fusion using convolutional neural networks, but these methods are sensitive to image misalignment due to the inherent deficiency in local-range feature interaction resulting in the performance degradation. To address this issue, a novel feature fusion framework of dual cross-attention transformers is proposed to model global feature interaction and capture complementary information across modalities simultaneously. This framework enhances the discriminability of object features through the query-guided cross-attention mechanism, leading to improved performance. However, stacking multiple transformer blocks for feature enhancement incurs a large number of parameters and high spatial complexity. To handle this, inspired by the human process of reviewing knowledge, an iterative interaction mechanism is proposed to share parameters among block-wise multimodal transformers, reducing model complexity and computation cost. The proposed method is general and effective to be integrated into different detection frameworks and used with different backbones. Experimental results on KAIST, FLIR, and VEDAI datasets show that the proposed method achieves superior performance and faster inference, making it suitable for various practical scenarios. Code will be available at https://github.com/chanchanchan97/ICAFusion.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
烟花应助宋宋采纳,获得10
1秒前
AU完成签到 ,获得积分10
1秒前
明理含莲应助景茶茶采纳,获得10
2秒前
2秒前
敷斩发布了新的文献求助10
3秒前
雪白的秀应助虚心萤采纳,获得10
3秒前
alice应助孤独的匕采纳,获得10
3秒前
嘉丽的后花园完成签到,获得积分10
3秒前
北冰石完成签到,获得积分10
3秒前
紧张的金毛完成签到,获得积分10
4秒前
LaTeXer完成签到,获得积分0
4秒前
Valrhona完成签到 ,获得积分10
4秒前
小鱼完成签到,获得积分10
5秒前
眼中星光完成签到,获得积分10
5秒前
今后应助快乐的心情采纳,获得10
6秒前
Thanks完成签到,获得积分10
6秒前
怕黑修杰完成签到 ,获得积分20
6秒前
下次见发布了新的文献求助10
6秒前
ding应助xph采纳,获得10
6秒前
鸣笛发布了新的文献求助10
6秒前
济民财完成签到,获得积分10
7秒前
量子星尘发布了新的文献求助10
7秒前
123完成签到,获得积分20
8秒前
Dan完成签到,获得积分10
8秒前
xiaoqi完成签到,获得积分10
9秒前
小樊没烦恼完成签到 ,获得积分10
9秒前
10秒前
小埋发布了新的文献求助10
10秒前
无奈的背包完成签到 ,获得积分20
11秒前
wjj119完成签到,获得积分10
11秒前
Lionking发布了新的文献求助80
11秒前
蒹葭苍苍应助NN采纳,获得30
11秒前
Jason完成签到,获得积分10
12秒前
12秒前
Regulusyang完成签到,获得积分10
13秒前
13秒前
宋宋发布了新的文献求助10
14秒前
14秒前
谜记完成签到,获得积分10
14秒前
小马哥完成签到,获得积分10
15秒前
高分求助中
(禁止应助)【重要!!请各位详细阅读】【科研通的精品贴汇总】 10000
Building Quantum Computers 1000
Nucleophilic substitution in azasydnone-modified dinitroanisoles 500
Molecular Cloning: A Laboratory Manual (Fourth Edition) 500
Social Epistemology: The Niches for Knowledge and Ignorance 500
优秀运动员运动寿命的人文社会学因素研究 500
Encyclopedia of Mathematical Physics 2nd Edition 420
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4243645
求助须知:如何正确求助?哪些是违规求助? 3777117
关于积分的说明 11857973
捐赠科研通 3431443
什么是DOI,文献DOI怎么找? 1883121
邀请新用户注册赠送积分活动 935043
科研通“疑难数据库(出版商)”最低求助积分说明 841531