CasFormer: Cascaded Transformer Based on Dynamic Voxel Pyramid for 3D Object Detection from Point Clouds

计算机科学 点云 人工智能 目标检测 体素 变压器 计算机视觉 级联 棱锥(几何) 模式识别(心理学) 电压 数学 化学 物理 几何学 色谱法 量子力学
作者
Xinglong Li,Xiaowei Zhang
出处
期刊:Lecture Notes in Computer Science 卷期号:: 299-311
标识
DOI:10.1007/978-981-99-8435-0_24
摘要

Recently, Transformers have been widely applied in 3-D object detection to model global contextual relationships in point cloud collections or for proposal refinement. However, the structural information in 3-D point clouds, especially to the distant and small objects is often incomplete, leading to difficulties in accurate detection using these methods. To address this issue, we propose a Cascaded Transformer based on Dynamic Voxel Pyramid (called CasFormer) for 3-D object detection from LiDAR point clouds. Specifically, we dynamically spread relevant features from the voxel pyramid based on the sparsity of each region of interest (RoI), capturing more rich semantic information for structurally incomplete objects. Furthermore, a cross-stage attention mechanism is employed to cascade the refined results of the Transformer in stage by stage, as well as to improve the training convergence of transformer. Extensive experiments demonstrate that our CasFormer achieves progressive performance in KITTI Dataset and Waymo Open Dataset. Compared to CT3D, our method outperforms it by 1.12% and 1.27% in the moderate and hard levels of car detection, respectively, on the KITTI online 3-D object detection leaderboard.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
研友_Z30GJ8发布了新的文献求助10
2秒前
1234发布了新的文献求助10
2秒前
背后勒完成签到,获得积分10
2秒前
所所应助笨笨的不评采纳,获得10
4秒前
开朗的诗槐完成签到 ,获得积分10
6秒前
今后应助甜甜盼夏采纳,获得10
7秒前
桐桐应助笨鸟一直飞采纳,获得10
8秒前
俭朴大开完成签到,获得积分10
10秒前
puzhongjiMiQ发布了新的文献求助10
11秒前
龙龙大忽悠完成签到 ,获得积分10
12秒前
123完成签到 ,获得积分10
13秒前
16秒前
帅气的樱桃完成签到,获得积分20
17秒前
今后应助科研通管家采纳,获得10
20秒前
bkagyin应助科研通管家采纳,获得10
20秒前
木子李完成签到,获得积分10
22秒前
右右发布了新的文献求助20
22秒前
23秒前
xx完成签到,获得积分10
23秒前
1234完成签到,获得积分10
25秒前
桐桐应助xx采纳,获得10
28秒前
娃哈哈发布了新的文献求助10
28秒前
赘婿应助小帆帆采纳,获得10
29秒前
慕青应助朴实怜阳采纳,获得20
29秒前
研友_59AB85完成签到,获得积分10
29秒前
卓矢完成签到 ,获得积分10
30秒前
30秒前
applelpypies完成签到 ,获得积分10
32秒前
shiwen完成签到,获得积分10
34秒前
封怜菡发布了新的文献求助10
34秒前
36秒前
科研小狗完成签到,获得积分10
38秒前
科研小狗发布了新的文献求助30
43秒前
43秒前
45秒前
46秒前
wwwwc发布了新的文献求助10
47秒前
无情石头发布了新的文献求助10
48秒前
小帆帆发布了新的文献求助10
50秒前
51秒前
高分求助中
Sustainable Land Management: Strategies to Cope with the Marginalisation of Agriculture 1000
Corrosion and Oxygen Control 600
Python Programming for Linguistics and Digital Humanities: Applications for Text-Focused Fields 500
Love and Friendship in the Western Tradition: From Plato to Postmodernity 500
Heterocyclic Stilbene and Bibenzyl Derivatives in Liverworts: Distribution, Structures, Total Synthesis and Biological Activity 500
重庆市新能源汽车产业大数据招商指南(两链两图两池两库两平台两清单两报告) 400
Division and square root. Digit-recurrence algorithms and implementations 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2549323
求助须知:如何正确求助?哪些是违规求助? 2176844
关于积分的说明 5606650
捐赠科研通 1897706
什么是DOI,文献DOI怎么找? 947166
版权声明 565447
科研通“疑难数据库(出版商)”最低求助积分说明 504020