Video Transformers: A Survey

计算机科学 维数之咒 变压器 人工智能 机器学习 归纳偏置 二次增长 多任务学习 算法 物理 管理 量子力学 电压 经济 任务(项目管理)
作者
Javier Selva,Anders Skaarup Johansen,Sérgio Escalera,Kamal Nasrollahi,Thomas B. Moeslund,Albert Clapés
出处
期刊:IEEE Transactions on Pattern Analysis and Machine Intelligence [IEEE Computer Society]
卷期号:: 1-20 被引量:58
标识
DOI:10.1109/tpami.2023.3243465
摘要

Transformer models have shown great success handling long-range interactions, making them a promising tool for modeling video. However, they lack inductive biases and scale quadratically with input length. These limitations are further exacerbated when dealing with the high dimensionality introduced by the temporal dimension. While there are surveys analyzing the advances of Transformers for vision, none focus on an in-depth analysis of video-specific designs. In this survey, we analyze the main contributions and trends of works leveraging Transformers to model video. Specifically, we delve into how videos are handled at the input level first. Then, we study the architectural changes made to deal with video more efficiently, reduce redundancy, re-introduce useful inductive biases, and capture long-term temporal dynamics. In addition, we provide an overview of different training regimes and explore effective self-supervised learning strategies for video. Finally, we conduct a performance comparison on the most common benchmark for Video Transformers (i.e., action classification), finding them to outperform 3D ConvNets even with less computational complexity.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
寄语明月完成签到,获得积分10
6秒前
LZR发布了新的文献求助10
7秒前
杨师傅完成签到 ,获得积分10
12秒前
微雨若,,完成签到 ,获得积分10
14秒前
李大白完成签到 ,获得积分10
16秒前
ymxlcfc完成签到 ,获得积分10
20秒前
ZH完成签到 ,获得积分10
20秒前
Heidi完成签到 ,获得积分10
23秒前
轩辕剑身完成签到,获得积分0
24秒前
haochi完成签到,获得积分10
26秒前
鳌小饭完成签到 ,获得积分10
33秒前
37秒前
江幻天完成签到,获得积分10
37秒前
tszjw168完成签到 ,获得积分10
38秒前
怀风发布了新的文献求助10
42秒前
欧欧欧导完成签到,获得积分10
44秒前
领导范儿应助科研通管家采纳,获得10
44秒前
44秒前
cdercder应助科研通管家采纳,获得10
44秒前
鳌小饭发布了新的文献求助10
45秒前
Xenia完成签到 ,获得积分10
46秒前
迷人面包完成签到,获得积分10
46秒前
早睡完成签到 ,获得积分10
50秒前
斯文的慕儿完成签到 ,获得积分10
52秒前
小伊001完成签到,获得积分10
54秒前
hyl-tcm完成签到 ,获得积分10
56秒前
FL完成签到,获得积分10
57秒前
舒适的天奇完成签到 ,获得积分10
1分钟前
洸彦完成签到 ,获得积分10
1分钟前
点点完成签到 ,获得积分10
1分钟前
韩医生口腔完成签到 ,获得积分10
1分钟前
1分钟前
踢球的孩子完成签到 ,获得积分10
1分钟前
风生发布了新的文献求助10
1分钟前
song完成签到 ,获得积分10
1分钟前
飞云发布了新的文献求助10
1分钟前
七月星河完成签到 ,获得积分10
1分钟前
有魅力天抒完成签到 ,获得积分10
1分钟前
1分钟前
高分求助中
Technologies supporting mass customization of apparel: A pilot project 600
Izeltabart tapatansine - AdisInsight 500
Chinesen in Europa – Europäer in China: Journalisten, Spione, Studenten 500
Arthur Ewert: A Life for the Comintern 500
China's Relations With Japan 1945-83: The Role of Liao Chengzhi // Kurt Werner Radtke 500
Two Years in Peking 1965-1966: Book 1: Living and Teaching in Mao's China // Reginald Hunt 500
Epigenetic Drug Discovery 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3815909
求助须知:如何正确求助?哪些是违规求助? 3359386
关于积分的说明 10402450
捐赠科研通 3077226
什么是DOI,文献DOI怎么找? 1690236
邀请新用户注册赠送积分活动 813667
科研通“疑难数据库(出版商)”最低求助积分说明 767743