Multi-Modal Feature Pyramid Transformer for RGB-Infrared Object Detection

人工智能 计算机科学 计算机视觉 RGB颜色模型 棱锥(几何) 变压器 特征(语言学) 模式识别(心理学) 情态动词 目标检测 特征提取 模式 工程类 数学 社会学 高分子化学 电气工程 社会科学 语言学 哲学 化学 几何学 电压
作者
Yaohui Zhu,Xiaoyu Sun,Miao Wang,Hua Huang
出处
期刊:IEEE Transactions on Intelligent Transportation Systems [Institute of Electrical and Electronics Engineers]
卷期号:24 (9): 9984-9995 被引量:19
标识
DOI:10.1109/tits.2023.3266487
摘要

RGB-Infrared multi-modal object detection utilizes diverse and complementary information, showing some advantages in intelligent transportation field. The main challenge of RGB-Infrared object detection is how to fuse the two modalities. The difficulty of fusion is reflected in two aspects: 1) large visual differences between modalities make it difficult to learn effective complementary features, 2) some misaligned RGB-Infrared images increase the difficulty of fusion. To this end, based on feature pyramid commonly used in object detection, we propose Multi-modal Feature Pyramid Transformer (MFPT) to fuse the two modalities. The proposed MFPT learns semantic and modal complementary information to enhance each modal features via intra-modal feature pyramid transformer and inter-modal feature pyramid transformer. The intra-modal feature pyramid transformer enables features to interact across space and scales, improving the semantic representations of features in each modality. The inter-modal feature pyramid transformer conducts feature interaction between modalities, enabling each modality to learn complementary features from other modalities. Meanwhile, the inter-modal feature pyramid transformer can also learn distance independent dependencies between modalities, which are not sensitive to misaligned images. Furthermore, a local attention mechanism is introduced within different windows into MFPT to achieve efficient correlation between regions of different scales or different modalities. Experimental results on two RGB-Infrared detection datasets demonstrate the proposed method is superior to state-of-the-art methods.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
冬菊完成签到 ,获得积分10
1秒前
6秒前
冷傲凝琴发布了新的文献求助10
10秒前
骨科AAA完成签到 ,获得积分20
14秒前
骨科小白完成签到 ,获得积分20
22秒前
24秒前
29秒前
科研人完成签到,获得积分20
35秒前
Bin_Liu完成签到,获得积分20
45秒前
CHEN完成签到 ,获得积分10
46秒前
hhh2018687完成签到,获得积分10
47秒前
52秒前
53秒前
开拖拉机的医学僧完成签到 ,获得积分10
56秒前
无情的匪完成签到 ,获得积分10
1分钟前
研友完成签到 ,获得积分10
1分钟前
研友_ZzrWKZ完成签到 ,获得积分10
1分钟前
天天向上完成签到 ,获得积分10
1分钟前
cdercder应助科研通管家采纳,获得20
1分钟前
1分钟前
hmhu完成签到,获得积分10
1分钟前
hmhu发布了新的文献求助10
1分钟前
小小王完成签到 ,获得积分10
1分钟前
1分钟前
fddd完成签到 ,获得积分10
1分钟前
紫金之巅完成签到 ,获得积分10
1分钟前
Balance Man完成签到 ,获得积分0
1分钟前
Ayn完成签到 ,获得积分10
1分钟前
呜呼啦呼完成签到 ,获得积分10
1分钟前
英俊的铭应助顺顺采纳,获得10
2分钟前
小李完成签到 ,获得积分10
2分钟前
laohu完成签到,获得积分10
2分钟前
2分钟前
lopper应助Bgeelyu采纳,获得10
2分钟前
威武画板完成签到 ,获得积分10
2分钟前
研友_Z30GJ8完成签到,获得积分0
2分钟前
Ava应助滕皓轩采纳,获得10
2分钟前
wwj1009完成签到 ,获得积分10
2分钟前
2分钟前
欣慰冬亦完成签到 ,获得积分10
2分钟前
高分求助中
Technologies supporting mass customization of apparel: A pilot project 600
Introduction to Strong Mixing Conditions Volumes 1-3 500
Tip60 complex regulates eggshell formation and oviposition in the white-backed planthopper, providing effective targets for pest control 400
A Field Guide to the Amphibians and Reptiles of Madagascar - Frank Glaw and Miguel Vences - 3rd Edition 400
China Gadabouts: New Frontiers of Humanitarian Nursing, 1941–51 400
The Healthy Socialist Life in Maoist China, 1949–1980 400
Walking a Tightrope: Memories of Wu Jieping, Personal Physician to China's Leaders 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3798521
求助须知:如何正确求助?哪些是违规求助? 3344082
关于积分的说明 10318430
捐赠科研通 3060628
什么是DOI,文献DOI怎么找? 1679732
邀请新用户注册赠送积分活动 806761
科研通“疑难数据库(出版商)”最低求助积分说明 763353