CTAFFNet: CNN–Transformer Adaptive Feature Fusion Object Detection Algorithm for Complex Traffic Scenarios

计算机科学 人工智能 融合 特征(语言学) 模式识别(心理学) 变压器 算法 基于对象 目标检测 计算机视觉 对象(语法) 工程类 电压 语言学 电气工程 哲学
作者
Xinlong Dong,Peicheng Shi,Taonian Liang,Aixi Yang
出处
期刊:Transportation Research Record [SAGE Publishing]
卷期号:2679 (1): 1947-1965 被引量:41
标识
DOI:10.1177/03611981241258753
摘要

As the core technology of an environmental perception system, object detection has received more and more attention and has become a hot research direction for intelligent driving vehicles. The CNN–Transformer hybrid model has poor generalization ability, making it difficult to meet the detection requirements for small objects in complex scenes. We propose a novel convolutional neural network (CNN)–Transformer Adaptive Feature Fusion Network (CTAFFNet) for object detection. First, we design a Local–Global Feature Fusion unit known as the Convolutional Transformation Adaptive Fusion Kernel (CTAFFK), which is integrated into CTAFFNet. The CTAFFK kernel utilizes two branches, namely CNN and Transformer, to extract local and global features from the image, and adaptively fuses the features from both branches. Subsequently, we develop an adaptive feature fusion strategy that combines local high-frequency and global low-frequency features to obtain comprehensive feature information. Finally, CTAFFNet employs an encoder–decoder structure to facilitate the flow of fused local–global information between different stages, ensuring the model’s generalization capabilities. Results from the experiment conducted on the large and challenging KITTI dataset demonstrate the effectiveness and efficiency of the proposed network. Compared with other mainstream networks, it achieves an average precision of 91.17%, particularly excelling in the detection of small objects at longer distances with a remarkable 70.18% accuracy, while also providing real-time detection capabilities.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
羊铁身完成签到 ,获得积分10
1秒前
1秒前
wins完成签到,获得积分10
1秒前
2秒前
NexusExplorer应助真是麻烦采纳,获得10
2秒前
高贵糖豆发布了新的文献求助10
2秒前
小杭76应助kuhao采纳,获得10
2秒前
太阳发布了新的文献求助10
3秒前
3秒前
zmy发布了新的文献求助10
3秒前
Ry0_完成签到,获得积分10
3秒前
3秒前
朴实初夏发布了新的文献求助10
4秒前
量子星尘发布了新的文献求助10
4秒前
炸弹完成签到,获得积分10
4秒前
6秒前
6秒前
jocelynhuihui发布了新的文献求助10
6秒前
Jimmy Ko发布了新的文献求助10
7秒前
科研通AI5应助阔达碧空采纳,获得10
7秒前
CY发布了新的文献求助10
7秒前
8秒前
8秒前
张垚发布了新的文献求助10
9秒前
孙伟健发布了新的文献求助10
9秒前
沅沅发布了新的文献求助10
9秒前
酷波er应助范森林采纳,获得30
9秒前
10秒前
大模型应助努力的小张采纳,获得10
10秒前
10秒前
vv发布了新的文献求助10
10秒前
10秒前
加油干完成签到 ,获得积分10
11秒前
12秒前
jocelynhuihui完成签到,获得积分10
12秒前
666完成签到,获得积分10
13秒前
13秒前
Apei完成签到,获得积分10
13秒前
哎呀哎呀呀完成签到,获得积分10
13秒前
syy完成签到 ,获得积分10
13秒前
高分求助中
Comprehensive Toxicology Fourth Edition 24000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
LRZ Gitlab附件(3D Matching of TerraSAR-X Derived Ground Control Points to Mobile Mapping Data 附件) 2000
Pipeline and riser loss of containment 2001 - 2020 (PARLOC 2020) 1000
World Nuclear Fuel Report: Global Scenarios for Demand and Supply Availability 2025-2040 800
Handbook of Social and Emotional Learning 800
The Social Work Ethics Casebook(2nd,Frederic G. R) 600
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 5131875
求助须知:如何正确求助?哪些是违规求助? 4333485
关于积分的说明 13500924
捐赠科研通 4170518
什么是DOI,文献DOI怎么找? 2286388
邀请新用户注册赠送积分活动 1287217
关于科研通互助平台的介绍 1228262