Real-time detector design for small targets based on bi-channel feature fusion mechanism

计算机科学 保险丝(电气) 骨干网 棱锥(几何) 目标检测 卷积神经网络 融合机制 融合 人工智能 探测器 过程(计算) 特征学习 特征(语言学) 模式识别(心理学) 块(置换群论) 频道(广播) 计算机视觉 特征提取 工程类 数学 计算机网络 哲学 电气工程 操作系统 脂质双层融合 电信 语言学 几何学
作者
Xiuling Zhang,Tingbo Wan,Ziyun Wu,Bingce Du
出处
期刊:Applied Intelligence [Springer Nature]
卷期号:52 (3): 2775-2784 被引量:4
标识
DOI:10.1007/s10489-021-02545-6
摘要

YOLOv4-tiny is a simplified version of YOLOv4 detector, which is extremely fast and with few parameters. However, the detection performance of YOLOv4-tiny is poor while the recognition of small targets and occluded objects is weak. It is mainly attributed to the lack of feature extraction ability and learning ability of the backbone. Furthermore, the feature pyramid network (FPN) cannot adequately fuse adjacent feature maps in the process of multi-scale feature fusion. In this paper, a real-time detector with a bi-channel feature fusion mechanism is proposed based on YOLOv4-tiny, called BFF-YOLO, which effectively improves the detection of small targets and occluded objects. BFF-YOLO is composed of two main components: feature extraction and feature fusion. In the process of feature extraction, inspired by the idea of cross-stage partial connections (CSP), an enhanced CSP block (ECSPBlock) is proposed for enhancing the feature extraction of the backbone and the learning capability of the network. Moreover, the Maxpool layer in YOLOv4-tiny, which is used for downsampling and tends to lose fine-grained information, is replaced with a convolutional layer. In the process of feature fusion, a bi-channel feature fusion pyramid network (BFPN) is proposed to adequately fuse adjacent feature maps of different scales so that each detection head has both shallow and deep features. Finally, with a small increase in parameters, BFF-YOLO has achieved 36.5% AP and 85.1% mAP on the COCO and VOC datasets, respectively.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
鲁远望应助finn采纳,获得10
刚刚
1秒前
1秒前
2秒前
穿西装的小卡完成签到 ,获得积分10
3秒前
游泳的酸菜铺盖面完成签到,获得积分10
3秒前
3秒前
肖肖完成签到,获得积分10
3秒前
20182531027完成签到,获得积分10
4秒前
Orange应助淡定的水彤采纳,获得10
4秒前
4秒前
mq完成签到,获得积分10
5秒前
心灵尔安发布了新的文献求助10
6秒前
研友_RLNDkZ发布了新的文献求助10
6秒前
FloraWang发布了新的文献求助10
8秒前
yq发布了新的文献求助10
8秒前
猪猪猪完成签到,获得积分20
9秒前
9秒前
10秒前
小嘴巴完成签到,获得积分10
11秒前
12秒前
甄泽森完成签到,获得积分10
12秒前
13秒前
13秒前
听话的富应助GikM采纳,获得10
13秒前
丘奇发布了新的文献求助10
14秒前
星辰大海应助反之采纳,获得10
14秒前
14秒前
丘比特应助云游的莫冷采纳,获得10
14秒前
14秒前
马不停蹄发布了新的文献求助10
15秒前
会撒娇的含巧完成签到,获得积分10
15秒前
饭团完成签到 ,获得积分10
15秒前
柏达完成签到,获得积分10
17秒前
caia发布了新的文献求助10
17秒前
Airlie完成签到,获得积分10
17秒前
18秒前
麦芽糖发布了新的文献求助20
18秒前
不想上班了完成签到 ,获得积分10
18秒前
Wanting发布了新的文献求助10
19秒前
高分求助中
Encyclopedia of Quaternary Science Third edition 2025 12000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
HIGH DYNAMIC RANGE CMOS IMAGE SENSORS FOR LOW LIGHT APPLICATIONS 1500
The Social Work Ethics Casebook: Cases and Commentary (revised 2nd ed.). Frederic G. Reamer 800
Beyond the sentence : discourse and sentential form / edited by Jessica R. Wirth 600
Holistic Discourse Analysis 600
Vertébrés continentaux du Crétacé supérieur de Provence (Sud-Est de la France) 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5343316
求助须知:如何正确求助?哪些是违规求助? 4478987
关于积分的说明 13941205
捐赠科研通 4375914
什么是DOI,文献DOI怎么找? 2404365
邀请新用户注册赠送积分活动 1396915
关于科研通互助平台的介绍 1369240