Powerful-IoU: More straightforward and faster bounding box regression loss with a nonmonotonic focusing mechanism

帕斯卡(单位) 计算机科学 跳跃式监视 单调函数 趋同(经济学) 功能(生物学) 最小边界框 回归 算法 人工智能 数学 统计 图像(数学) 数学分析 进化生物学 经济 生物 程序设计语言 经济增长
作者
Can Liu,Kaige Wang,Qing Li,Fukun Zhao,Kun Zhao,Hongtu Ma
出处
期刊:Neural Networks [Elsevier]
卷期号:170: 276-284
标识
DOI:10.1016/j.neunet.2023.11.041
摘要

Bounding box regression (BBR) is one of the core tasks in object detection, and the BBR loss function significantly impacts its performance. However, we have observed that existing IoU-based loss functions suffer from unreasonable penalty factors, leading to anchor boxes expanding during regression and significantly slowing down convergence. To address this issue, we intensively analyzed the reasons for anchor box enlargement. In response, we propose a Powerful-IoU (PIoU) loss function, which combines a target size-adaptive penalty factor and a gradient-adjusting function based on anchor box quality. The PIoU loss guides anchor boxes to regress along efficient paths, resulting in faster convergence than existing IoU-based losses. Additionally, we investigate the focusing mechanism and introduce a non-monotonic attention layer that was combined with PIoU to obtain a new loss function PIoU v2. PIoU v2 loss enhances the capability to focus on anchor boxes of medium quality. By incorporating PIoU v2 into popular object detectors such as YOLOv8 and DINO, we achieved an increase in average precision (AP) and improved performance compared to their original loss functions on the MS COCO and PASCAL VOC datasets, thus validating the effectiveness of our proposed improvement strategies.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
小二郎应助youyi123采纳,获得10
5秒前
6秒前
平生完成签到 ,获得积分10
7秒前
搜集达人应助追寻的盼山采纳,获得10
9秒前
10秒前
lym完成签到,获得积分10
11秒前
充电宝应助稳重冰兰采纳,获得10
11秒前
lu关注了科研通微信公众号
13秒前
16秒前
18秒前
19秒前
Jasper应助超帅的心锁采纳,获得10
19秒前
高院士发布了新的文献求助10
23秒前
稳重冰兰发布了新的文献求助10
24秒前
可爱的函函应助单薄怜寒采纳,获得10
24秒前
宇文追命完成签到 ,获得积分10
26秒前
超帅的心锁完成签到,获得积分20
27秒前
28秒前
糖糖完成签到,获得积分10
28秒前
似锦繁花完成签到 ,获得积分10
30秒前
31秒前
香蕉觅云应助科研通管家采纳,获得10
31秒前
31秒前
隐形曼青应助科研通管家采纳,获得10
31秒前
充电宝应助科研通管家采纳,获得10
31秒前
李健应助科研通管家采纳,获得10
31秒前
赘婿应助科研通管家采纳,获得10
31秒前
ding应助科研通管家采纳,获得30
31秒前
丘比特应助科研通管家采纳,获得10
31秒前
Jasper应助科研通管家采纳,获得10
31秒前
科研通AI2S应助科研通管家采纳,获得10
31秒前
31秒前
31秒前
祝何完成签到 ,获得积分10
32秒前
情怀应助细腻的山水采纳,获得10
33秒前
糖糖发布了新的文献求助10
37秒前
宋晓蓝完成签到,获得积分10
39秒前
39秒前
unicorn完成签到,获得积分10
39秒前
高分求助中
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 1000
The Illustrated History of Gymnastics 800
Yuwu Song, Biographical Dictionary of the People's Republic of China 800
Herman Melville: A Biography (Volume 1, 1819-1851) 600
Division and square root. Digit-recurrence algorithms and implementations 500
Hemerologies of Assyrian and Babylonian Scholars 500
Manual of Clinical Microbiology, 13th Edition 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2499743
求助须知:如何正确求助?哪些是违规求助? 2155022
关于积分的说明 5512468
捐赠科研通 1875853
什么是DOI,文献DOI怎么找? 932774
版权声明 563780
科研通“疑难数据库(出版商)”最低求助积分说明 498487