亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Exploiting Temporal Contexts with Strided Transformer for 3D Human Pose Estimation

编码器 变压器 计算机科学 计算 人工智能 模式识别(心理学) 算法 电压 工程类 操作系统 电气工程
作者
Wenhao Li,Hong Liu,Runwei Ding,Mengyuan Liu,Pichao Wang,Wenming Yang
出处
期刊:Cornell University - arXiv 被引量:16
标识
DOI:10.48550/arxiv.2103.14304
摘要

Despite the great progress in 3D human pose estimation from videos, it is still an open problem to take full advantage of a redundant 2D pose sequence to learn representative representations for generating one 3D pose. To this end, we propose an improved Transformer-based architecture, called Strided Transformer, which simply and effectively lifts a long sequence of 2D joint locations to a single 3D pose. Specifically, a Vanilla Transformer Encoder (VTE) is adopted to model long-range dependencies of 2D pose sequences. To reduce the redundancy of the sequence, fully-connected layers in the feed-forward network of VTE are replaced with strided convolutions to progressively shrink the sequence length and aggregate information from local contexts. The modified VTE is termed as Strided Transformer Encoder (STE), which is built upon the outputs of VTE. STE not only effectively aggregates long-range information to a single-vector representation in a hierarchical global and local fashion, but also significantly reduces the computation cost. Furthermore, a full-to-single supervision scheme is designed at both full sequence and single target frame scales applied to the outputs of VTE and STE, respectively. This scheme imposes extra temporal smoothness constraints in conjunction with the single target frame supervision and hence helps produce smoother and more accurate 3D poses. The proposed Strided Transformer is evaluated on two challenging benchmark datasets, Human3.6M and HumanEva-I, and achieves state-of-the-art results with fewer parameters. Code and models are available at \url{https://github.com/Vegetebird/StridedTransformer-Pose3D}.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Hyp完成签到 ,获得积分10
刚刚
科研学术完成签到,获得积分10
3秒前
灶灶完成签到 ,获得积分10
9秒前
10秒前
SHF完成签到,获得积分10
13秒前
酒渡完成签到,获得积分10
15秒前
科研通AI6应助Yuanyuan采纳,获得10
17秒前
20秒前
wang完成签到 ,获得积分10
21秒前
22秒前
bogula1112完成签到 ,获得积分10
23秒前
shuozi发布了新的文献求助10
24秒前
24秒前
浮游应助tooheys1000采纳,获得10
25秒前
nxy完成签到 ,获得积分10
29秒前
MissingParadise完成签到 ,获得积分10
30秒前
科研通AI6应助vvvvba0202采纳,获得10
30秒前
31秒前
34秒前
Fuaget发布了新的文献求助10
34秒前
Yuanyuan发布了新的文献求助10
37秒前
852应助科研通管家采纳,获得10
40秒前
天天快乐应助科研通管家采纳,获得50
40秒前
科研通AI6应助科研通管家采纳,获得10
40秒前
大个应助科研通管家采纳,获得10
40秒前
42秒前
47秒前
47秒前
简单的翠曼完成签到 ,获得积分10
47秒前
肆三一发布了新的文献求助10
52秒前
小福同学完成签到 ,获得积分10
56秒前
57秒前
认真的方盒完成签到 ,获得积分10
1分钟前
1分钟前
1分钟前
科研通AI6应助霸王丹采纳,获得10
1分钟前
1分钟前
koui完成签到 ,获得积分10
1分钟前
shuozi完成签到,获得积分10
1分钟前
讨厌乐跑完成签到 ,获得积分10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
List of 1,091 Public Pension Profiles by Region 1621
Lloyd's Register of Shipping's Approach to the Control of Incidents of Brittle Fracture in Ship Structures 800
Biology of the Reptilia. Volume 21. Morphology I. The Skull and Appendicular Locomotor Apparatus of Lepidosauria 620
A Guide to Genetic Counseling, 3rd Edition 500
Laryngeal Mask Anesthesia: Principles and Practice. 2nd ed 500
The Composition and Relative Chronology of Dynasties 16 and 17 in Egypt 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5561175
求助须知:如何正确求助?哪些是违规求助? 4646348
关于积分的说明 14678343
捐赠科研通 4587587
什么是DOI,文献DOI怎么找? 2517175
邀请新用户注册赠送积分活动 1490439
关于科研通互助平台的介绍 1461340