BEVFormer: Learning Bird’s-Eye-View Representation from Multi-camera Images via Spatiotemporal Transformers

计算机科学 人工智能 计算机视觉 网格 感知 分割 利用 数学 计算机安全 神经科学 生物 几何学
作者
Zhiqi Li,Wenhai Wang,Hongyang Li,Enze Xie,Chonghao Sima,Tong Lu,Yu Qiao,Jifeng Dai
出处
期刊:Lecture Notes in Computer Science 卷期号:: 1-18 被引量:90
标识
DOI:10.1007/978-3-031-20077-9_1
摘要

3D visual perception tasks, including 3D detection and map segmentation based on multi-camera images, are essential for autonomous driving systems. In this work, we present a new framework termed BEVFormer, which learns unified BEV representations with spatiotemporal transformers to support multiple autonomous driving perception tasks. In a nutshell, BEVFormer exploits both spatial and temporal information by interacting with spatial and temporal space through predefined grid-shaped BEV queries. To aggregate spatial information, we design spatial cross-attention that each BEV query extracts the spatial features from the regions of interest across camera views. For temporal information, we propose temporal self-attention to recurrently fuse the history BEV information. Our approach achieves the new state-of-the-art 56.9% in terms of NDS metric on the nuScenes test set, which is 9.0 points higher than previous best arts and on par with the performance of LiDAR-based baselines. The code is available at https://github.com/zhiqi-li/BEVFormer .

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
chloe发布了新的文献求助10
1秒前
2秒前
3秒前
慈祥的晓蓝完成签到 ,获得积分10
4秒前
5秒前
华仔应助跳跃初露采纳,获得80
8秒前
风来枫去发布了新的文献求助10
8秒前
代骜珺发布了新的文献求助10
9秒前
taizi发布了新的文献求助10
9秒前
11秒前
jacklin完成签到,获得积分10
14秒前
14秒前
funny完成签到,获得积分10
15秒前
可爱迪留下了新的社区评论
16秒前
songvv完成签到,获得积分20
17秒前
17秒前
yingying关注了科研通微信公众号
17秒前
阿大呆呆应助鹿鹿采纳,获得10
17秒前
17秒前
19秒前
冥冥之极为昭昭完成签到,获得积分10
19秒前
chloe完成签到,获得积分10
19秒前
songvv发布了新的文献求助10
20秒前
桐桐应助MIranda采纳,获得10
20秒前
24秒前
闪闪三问发布了新的文献求助10
24秒前
SOLOMON应助songvv采纳,获得10
26秒前
风来枫去完成签到,获得积分10
27秒前
28秒前
29秒前
31秒前
baishu完成签到,获得积分10
31秒前
闪闪三问完成签到,获得积分10
31秒前
33秒前
33秒前
萊以托尔福完成签到,获得积分10
34秒前
kuku发布了新的文献求助10
36秒前
centlay应助songvv采纳,获得10
36秒前
36秒前
flame完成签到,获得积分10
37秒前
高分求助中
【本贴是提醒信息,请勿应助】请在求助之前详细阅读求助说明!!!! 20000
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 1000
The Three Stars Each: The Astrolabes and Related Texts 900
Yuwu Song, Biographical Dictionary of the People's Republic of China 800
Multifunctional Agriculture, A New Paradigm for European Agriculture and Rural Development 600
Challenges, Strategies, and Resiliency in Disaster and Risk Management 500
Bernd Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2481682
求助须知:如何正确求助?哪些是违规求助? 2144277
关于积分的说明 5469424
捐赠科研通 1866803
什么是DOI,文献DOI怎么找? 927830
版权声明 563039
科研通“疑难数据库(出版商)”最低求助积分说明 496404