Vehicle Detection Based on Adaptive Multimodal Feature Fusion and Cross-Modal Vehicle Index Using RGB-T Images

人工智能 计算机科学 RGB颜色模型 计算机视觉 特征(语言学) 目标检测 棱锥(几何) 特征提取 情态动词 模式识别(心理学) 数学 几何学 语言学 哲学 化学 高分子化学
作者
Yuanfeng Wu,Xinran Guan,Boya Zhao,Li Ni,Min Huang
出处
期刊:IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing [Institute of Electrical and Electronics Engineers]
卷期号:16: 8166-8177 被引量:15
标识
DOI:10.1109/jstars.2023.3294624
摘要

Target detection is a critical task in interpreting aerial images. Small target detection, such as vehicles, is challenging. Different lighting conditions affect the accuracy of vehicle detection. For example, vehicles are difficult to distinguish from the background in RGB images under low illumination conditions. In contrast, under high illumination conditions, the color and texture of vehicles are not significantly different in thermal infrared (TIR) images. To improve the accuracy of vehicle detection under various illumination conditions, we propose an adaptive multi-modal feature fusion and cross-modal vehicle index (AFFCM) model for vehicle detection. Based on the single-stage object detection model, AFFCM uses red, green, blue, and thermal infrared (RGB-T) images. It comprises three parts: 1) the softpooling channel attention (SCA) mechanism calculates the cross-modal feature weights of the RGB and TIR features using a fully connected layer during global weighted pooling. 2) We design a multi-modal adaptive feature fusion (MAFF) module based on the cross-modal feature weights derived from the SCA mechanism. The MAFF selects features with high weight, compresses redundant features with low weight, and performs adaptive fusion using a multi-scale feature pyramid. 3) A cross-modal vehicle index is established to extract the target area, suppress complex background information, and minimize false alarms in vehicle detection. The mean average precision (mAP) on the Drone Vehicle dataset are 14.44% and 5.02% higher than those obtained using only RGB or TIR images. The mAP is 2.63% higher than that of state-of-the-art (SOTA) methods that utilize RGB and TIR images.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
ivy完成签到 ,获得积分10
刚刚
hr完成签到 ,获得积分10
2秒前
开朗娩完成签到,获得积分10
5秒前
慕青应助zhien采纳,获得10
5秒前
水门发布了新的文献求助30
7秒前
tdtk发布了新的文献求助10
12秒前
Jasper应助水门采纳,获得10
13秒前
香山叶正红完成签到 ,获得积分10
15秒前
datang完成签到,获得积分10
17秒前
今天不学习明天变垃圾完成签到,获得积分10
17秒前
左孤容完成签到 ,获得积分10
21秒前
Lanny完成签到 ,获得积分10
22秒前
RAmos_1982完成签到,获得积分10
25秒前
Poman完成签到,获得积分10
25秒前
Lori完成签到,获得积分10
25秒前
孙非完成签到,获得积分10
25秒前
科研通AI5应助tdtk采纳,获得10
26秒前
28秒前
秋秋完成签到,获得积分10
32秒前
饿了就次爪爪完成签到 ,获得积分10
33秒前
爱听歌契完成签到 ,获得积分10
33秒前
35秒前
36秒前
Hello应助奥丁蒂法采纳,获得10
37秒前
温暖小松鼠完成签到 ,获得积分10
39秒前
SJW--666完成签到,获得积分0
41秒前
涵哈哈哈哈哈完成签到 ,获得积分10
41秒前
抚琴祛魅完成签到 ,获得积分10
42秒前
五环完成签到,获得积分10
43秒前
秋秋发布了新的文献求助10
43秒前
44秒前
Echoheart发布了新的文献求助10
45秒前
48秒前
48秒前
巧克力完成签到 ,获得积分10
51秒前
SC发布了新的文献求助10
53秒前
bkagyin应助摩登灰太狼采纳,获得10
53秒前
归尘发布了新的文献求助10
55秒前
56秒前
fffffffffffffff完成签到 ,获得积分10
56秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
Maneuvering of a Damaged Navy Combatant 650
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
Mixing the elements of mass customisation 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3779363
求助须知:如何正确求助?哪些是违规求助? 3324881
关于积分的说明 10220321
捐赠科研通 3040066
什么是DOI,文献DOI怎么找? 1668529
邀请新用户注册赠送积分活动 798717
科研通“疑难数据库(出版商)”最低求助积分说明 758503