ETAM: Ensemble transformer with attention modules for detection of small objects

计算机科学 编码器 帕斯卡(单位) 目标检测 变压器 计算机视觉 对象(语法) 人工智能 模式识别(心理学) 电压 物理 量子力学 程序设计语言 操作系统
作者
Jiangnan Zhang,Kewen Xia,Zhiyi Huang,Sijie Wang,Romoke Grace Akindele
出处
期刊:Expert Systems With Applications [Elsevier]
卷期号:224: 119997-119997 被引量:10
标识
DOI:10.1016/j.eswa.2023.119997
摘要

Detecting small objects is critical to many submissions, such as automatic drive and lung nodule detection. However, small object detection is challenging with low-resolution features. Therefore, the linchpin of small object detection is to design an effective encoder that can extract subtle features. In this paper, we present a powerful encoder, called Ensemble Transformer with Attention Modules (ETAM) encoder, for abstracting the subtle small object features without sacrificing the capability of larger object detection. In ETAM, a Magnifying Glass (MG) module is proposed to focus on representative features of small objects. Then, the Quadruple Attention (QA) is designed to enrich the small object features with width and height in addition to channel and position. To accommodate both small and large objects, we use ensemble learning in our ETAM encoder, which has two branches. Experimental results show that ETAM significantly improves small object detection based on PASCAL VOC, MS-COCO, VisDrone2019, and LIDC-IDRI. With ETAM, the mAP for small objects is improved up to 91.7% based on the four datasets.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
pocky发布了新的文献求助10
6秒前
6秒前
8秒前
12秒前
15秒前
Ana发布了新的文献求助10
16秒前
姽婳wy发布了新的文献求助10
16秒前
研友_VZG7GZ应助科研通管家采纳,获得10
17秒前
搜集达人应助科研通管家采纳,获得10
17秒前
17秒前
彭于晏应助科研通管家采纳,获得10
17秒前
小马甲应助jiutian采纳,获得10
17秒前
AMENG发布了新的文献求助10
21秒前
Hello应助纹银采纳,获得10
25秒前
tzjz_zrz完成签到,获得积分10
26秒前
26秒前
28秒前
shinysparrow应助硕小牛采纳,获得10
30秒前
等待雅霜发布了新的文献求助10
30秒前
cgk发布了新的文献求助10
31秒前
思源应助xyx采纳,获得10
31秒前
jiutian发布了新的文献求助10
31秒前
34秒前
35秒前
壮观果汁完成签到 ,获得积分10
38秒前
谷歌发布了新的文献求助10
38秒前
38秒前
38秒前
丁逍遥完成签到 ,获得积分10
39秒前
zjk发布了新的文献求助10
40秒前
43秒前
43秒前
sxh发布了新的文献求助10
43秒前
汉堡包应助ysta采纳,获得10
43秒前
Alan完成签到 ,获得积分10
44秒前
kalala完成签到,获得积分10
44秒前
45秒前
科研通AI2S应助感动语蝶采纳,获得10
46秒前
CipherSage应助毛毛采纳,获得10
46秒前
研友_Z1eDgZ发布了新的文献求助10
47秒前
高分求助中
Formgebungs- und Stabilisierungsparameter für das Konstruktionsverfahren der FiDU-Freien Innendruckumformung von Blech 1000
The Illustrated History of Gymnastics 800
The Bourse of Babylon : market quotations in the astronomical diaries of Babylonia 680
Division and square root. Digit-recurrence algorithms and implementations 500
Elgar Encyclopedia of Consumer Behavior 300
機能營養學前瞻(3 Ed.) 300
Improving the ductility and toughness of Fe-Cr-B cast irons 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2508873
求助须知:如何正确求助?哪些是违规求助? 2159424
关于积分的说明 5528734
捐赠科研通 1879861
什么是DOI,文献DOI怎么找? 935385
版权声明 564126
科研通“疑难数据库(出版商)”最低求助积分说明 499453