YOLO-Pose: Enhancing YOLO for Multi Person Pose Estimation Using Object Keypoint Similarity Loss

推论 姿势 公制(单位) 跳跃式监视 计算机科学 人工智能 相似性(几何) 对象(语法) 集合(抽象数据类型) 目标检测 最小边界框 图像(数学) 试验装置 计算机视觉 机器学习 模式识别(心理学) 工程类 运营管理 程序设计语言
作者
Debapriya Maji,Soyeb Nagori,Manu Mathew,Deepak Poddar
出处
期刊:Cornell University - arXiv 被引量:3
标识
DOI:10.48550/arxiv.2204.06806
摘要

We introduce YOLO-pose, a novel heatmap-free approach for joint detection, and 2D multi-person pose estimation in an image based on the popular YOLO object detection framework. Existing heatmap based two-stage approaches are sub-optimal as they are not end-to-end trainable and training relies on a surrogate L1 loss that is not equivalent to maximizing the evaluation metric, i.e. Object Keypoint Similarity (OKS). Our framework allows us to train the model end-to-end and optimize the OKS metric itself. The proposed model learns to jointly detect bounding boxes for multiple persons and their corresponding 2D poses in a single forward pass and thus bringing in the best of both top-down and bottom-up approaches. Proposed approach doesn't require the postprocessing of bottom-up approaches to group detected keypoints into a skeleton as each bounding box has an associated pose, resulting in an inherent grouping of the keypoints. Unlike top-down approaches, multiple forward passes are done away with since all persons are localized along with their pose in a single inference. YOLO-pose achieves new state-of-the-art results on COCO validation (90.2% AP50) and test-dev set (90.3% AP50), surpassing all existing bottom-up approaches in a single forward pass without flip test, multi-scale testing, or any other test time augmentation. All experiments and results reported in this paper are without any test time augmentation, unlike traditional approaches that use flip-test and multi-scale testing to boost performance. Our training codes will be made publicly available at https://github.com/TexasInstruments/edgeai-yolov5 and https://github.com/TexasInstruments/edgeai-yolox
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
LLL完成签到,获得积分10
5秒前
YINZHE应助神奇海螺采纳,获得10
6秒前
邵孤丝完成签到,获得积分20
8秒前
虚心的唯雪完成签到,获得积分10
13秒前
zzz完成签到,获得积分10
14秒前
热心市民远完成签到,获得积分10
15秒前
17秒前
21秒前
YINZHE应助别说话采纳,获得10
21秒前
可爱迪应助科研通管家采纳,获得10
23秒前
可爱迪应助科研通管家采纳,获得10
23秒前
乐乐应助科研通管家采纳,获得10
23秒前
思源应助科研通管家采纳,获得10
23秒前
可爱迪应助科研通管家采纳,获得10
23秒前
情怀应助科研通管家采纳,获得10
23秒前
colin发布了新的文献求助10
24秒前
酷波er应助JET_Li采纳,获得10
25秒前
28秒前
28秒前
30秒前
漠北发布了新的文献求助10
34秒前
Willing完成签到 ,获得积分10
34秒前
Akim应助colin采纳,获得10
37秒前
漠北完成签到,获得积分10
41秒前
小二郎应助yeyeye采纳,获得10
42秒前
阔落完成签到,获得积分10
42秒前
47秒前
52秒前
可可发布了新的文献求助10
55秒前
FY发布了新的文献求助200
58秒前
ererrrr发布了新的文献求助10
58秒前
1分钟前
1分钟前
无花果应助别说话采纳,获得10
1分钟前
wuniuniu完成签到,获得积分10
1分钟前
温柔野心家完成签到 ,获得积分10
1分钟前
丹霞应助ererrrr采纳,获得10
1分钟前
Di完成签到 ,获得积分10
1分钟前
mgh完成签到,获得积分20
1分钟前
不安的嘉懿完成签到 ,获得积分10
1分钟前
高分求助中
请在求助之前详细阅读求助说明!!!! 20000
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 1000
The Three Stars Each: The Astrolabes and Related Texts 900
Yuwu Song, Biographical Dictionary of the People's Republic of China 700
[Lambert-Eaton syndrome without calcium channel autoantibodies] 520
Bernd Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
A radiographic standard of reference for the growing knee 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2471367
求助须知:如何正确求助?哪些是违规求助? 2137984
关于积分的说明 5448051
捐赠科研通 1861959
什么是DOI,文献DOI怎么找? 925987
版权声明 562747
科研通“疑难数据库(出版商)”最低求助积分说明 495308