亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-time Object Detection

人工智能 目标检测 计算机科学 比例(比率) 代表(政治) 对象(语法) 计算机视觉 视觉对象识别的认知神经科学 模式识别(心理学) 机器学习 政治学 量子力学 政治 物理 法学
作者
Yuming Chen,Xinbin Yuan,Jiabao Wang,Ruiqi Wu,Xiang Li,Qibin Hou,Ming‐Ming Cheng
出处
期刊:IEEE Transactions on Pattern Analysis and Machine Intelligence [IEEE Computer Society]
卷期号:: 1-14 被引量:7
标识
DOI:10.1109/tpami.2025.3538473
摘要

We aim at providing the object detection community with an efficient and performant object detector, termed YOLO-MS. The core design is based on a series of investigations on how multi-branch features of the basic block and convolutions with different kernel sizes affect the detection performance of objects at different scales. The outcome is a new strategy that can significantly enhance multi-scale feature representations of real-time object detectors. To verify the effectiveness of our work, we train our YOLO-MS on the MS COCO dataset from scratch without relying on any other large-scale datasets, like ImageNet or pre-trained weights. Without bells and whistles, our YOLO-MS outperforms the recent state-of-the-art real-time object detectors, including YOLO-v7, RTMDet, and YOLO-v8. Taking the XS version of YOLO-MS as an example, it can achieve an AP score of 42+% on MS COCO, which is about 2% higher than RTMDet with the same model size. Furthermore, our work can also serve as a plug-and-play module for other YOLO models. Typically, our method significantly advances the APs, APl, and AP of YOLOv8-N from 18%+, 52%+, and 37%+ to 20%+, 55%+, and 40%+, respectively, with even fewer parameters and MACs. Code and trained models are publicly available at https://github.com/FishAndWasabi/YOLO-MS. We also provide the Jittor version at https://github.com/NK-JittorCV/nk-yolo.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
32秒前
50秒前
科研通AI2S应助科研通管家采纳,获得10
50秒前
科研通AI2S应助科研通管家采纳,获得10
50秒前
1分钟前
1分钟前
herococa应助科研通管家采纳,获得10
2分钟前
慕青应助科研通管家采纳,获得10
2分钟前
汉堡包应助科研通管家采纳,获得10
2分钟前
HTniconico完成签到 ,获得积分10
2分钟前
2分钟前
浚稚完成签到 ,获得积分10
4分钟前
4分钟前
科研通AI2S应助科研通管家采纳,获得10
4分钟前
Orange应助科研通管家采纳,获得30
4分钟前
Sandy应助科研通管家采纳,获得10
4分钟前
科研通AI2S应助科研通管家采纳,获得10
4分钟前
搜集达人应助科研通管家采纳,获得10
4分钟前
5分钟前
脑洞疼应助老实的火采纳,获得10
5分钟前
李爱国应助Sally采纳,获得10
5分钟前
5分钟前
5分钟前
老实的火发布了新的文献求助10
5分钟前
Sally发布了新的文献求助10
5分钟前
桥西小河完成签到 ,获得积分10
6分钟前
6分钟前
Sandy应助科研通管家采纳,获得10
6分钟前
脑洞疼应助科研通管家采纳,获得10
6分钟前
7分钟前
7分钟前
7分钟前
7分钟前
韦颖发布了新的文献求助10
7分钟前
niceweiwei完成签到 ,获得积分10
8分钟前
韦颖完成签到,获得积分10
8分钟前
8分钟前
光合作用完成签到,获得积分10
8分钟前
稻子完成签到 ,获得积分10
8分钟前
顾矜应助Sally采纳,获得10
8分钟前
高分求助中
The Mother of All Tableaux Order, Equivalence, and Geometry in the Large-scale Structure of Optimality Theory 1370
生物降解型栓塞微球市场(按产品类型、应用和最终用户)- 2030 年全球预测 1000
Medical English Clear and Simple(By Melodie Hull) 400
Oxford English for Careers: Nursing / Medicine • 🩺 出版社:Oxford University Press • 400
English in Medicine(作者:Eric H. Glendinning) 400
Ecological and Human Health Impacts of Contaminated Food and Environments 400
Phylogenetic study of the order Polydesmida (Myriapoda: Diplopoda) 360
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 计算机科学 内科学 纳米技术 复合材料 化学工程 遗传学 催化作用 物理化学 基因 冶金 量子力学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 3927756
求助须知:如何正确求助?哪些是违规求助? 3472560
关于积分的说明 10972667
捐赠科研通 3202310
什么是DOI,文献DOI怎么找? 1769341
邀请新用户注册赠送积分活动 858024
科研通“疑难数据库(出版商)”最低求助积分说明 796262