BEV transformer for visual 3D object detection applied with retentive mechanism

变压器 计算机科学 机制(生物学) 计算机视觉 人工智能 工程类 物理 电气工程 电压 量子力学
作者
Jincheng Pan,Xiaoci Huang,Suyun Luo,Fang Ma
出处
期刊:Transactions of the Institute of Measurement and Control [SAGE Publishing]
标识
DOI:10.1177/01423312241308367
摘要

Three-dimensional (3D) vision perception tasks utilizing multiple cameras are pivotal for autonomous driving systems, encompassing both 3D object detection and map segmentation. We introduce a novel approach dubbed RetentiveBEV, leveraging Transformer to learn spatiotemporal features from Bird’s Eye View (BEV) perspectives. These BEV representations form the foundational layer for further autonomous driving tasks. Succinctly, spatial features within regions of interest (ROIs) are harvested via spatial cross-attention, while temporal dynamics are integrated using temporal self-attention, enriching the BEV with historical data. Our spatial cross-attention is enhanced with a retentive mechanism, prioritizing information surrounding the focal points and enabling the decomposition of this attention mechanism to bolster computational efficiency. On the nuScenes data set test split, our approach achieves a nuScenes Detection Score (NDS) score of 60.4%, without additional training data, which is an 8.7% improvement over the baseline (BEVFormer-base), and is close to the current state-of-the-art method SparseBEV, which gets NDS 65.7% as of August 2024. On the Val split of nuScenes, our method achieves the performance of 55.8 NDS while maintaining a real-time inference speed of 25.3 FPS, and we are currently working on further accelerating inference using TensorRT on the existing basis (the specification of mAP and NDS would be illustrated by equations (12) and (13)). The integration of the retentive mechanism notably boosts the precision and recall in 3D object detection while also expediting the inference process.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
cas发布了新的文献求助30
1秒前
111完成签到 ,获得积分10
1秒前
2秒前
LYW应助qq采纳,获得60
3秒前
修士发布了新的文献求助10
4秒前
李白发布了新的文献求助20
5秒前
雪白的以丹完成签到,获得积分10
6秒前
铁柱完成签到,获得积分10
7秒前
9秒前
CodeCraft应助机智野狼采纳,获得10
10秒前
12秒前
共享精神应助高高的蜗牛采纳,获得10
12秒前
14秒前
听风发布了新的文献求助10
16秒前
16秒前
谦行鹏路完成签到,获得积分10
16秒前
17秒前
怎么会睡不醒完成签到 ,获得积分10
17秒前
钰泠发布了新的文献求助10
17秒前
17秒前
cas完成签到,获得积分10
19秒前
李白完成签到,获得积分10
19秒前
邓佳鑫Alan应助1221采纳,获得10
19秒前
浪老师发布了新的文献求助10
20秒前
ldx完成签到,获得积分10
21秒前
lemon发布了新的文献求助10
21秒前
22秒前
干净的琦应助SUN采纳,获得100
24秒前
安详的斓完成签到,获得积分10
24秒前
lll完成签到,获得积分10
25秒前
27秒前
丘比特应助ping采纳,获得10
28秒前
29秒前
29秒前
30秒前
kingwill发布了新的文献求助20
30秒前
王小磊完成签到,获得积分10
31秒前
32秒前
初心发布了新的文献求助10
34秒前
35秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Developing Genetic Editing Tools for Lysobacter 2000
卤化钙钛矿人工突触的研究 2000
Моделирование процессов самоорганизации в кристаллообразующих системах 1000
History of U.S. Space Surveillance and Satellite Cataloging 1000
Malcolm Fraser : a biography 700
Handbook of Optical Systems,Volume 6:Advanced Physical Optics 666
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6514777
求助须知:如何正确求助?哪些是违规求助? 8308186
关于积分的说明 17754941
捐赠科研通 5616589
什么是DOI,文献DOI怎么找? 2924751
邀请新用户注册赠送积分活动 1901762
关于科研通互助平台的介绍 1763125