亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

DeepFusion: Lidar-Camera Deep Fusion for Multi-Modal 3D Object Detection

激光雷达 计算机科学 人工智能 计算机视觉 点云 稳健性(进化) 目标检测 像素 情态动词 行人检测 遥感 模式识别(心理学) 地理 行人 生物化学 化学 考古 高分子化学 基因
作者
Yingwei Li,Adams Wei Yu,Tianjian Meng,Ben Caine,Jiquan Ngiam,Daiyi Peng,Junyang Shen,Bo Wu,Yifeng Lu,Denny Zhou,Quoc V. Le,Alan Yuille,Mingxing Tan
标识
DOI:10.1109/cvpr52688.2022.01667
摘要

Lidars and cameras are critical sensors that provide complementary information for 3D detection in autonomous driving. While prevalent multi-modal methods [34], [36] simply decorate raw lidar point clouds with camera features and feed them directly to existing 3D detection models, our study shows that fusing camera features with deep lidar features instead of raw points, can lead to better performance. However, as those features are often augmented and aggregated, a key challenge in fusion is how to effectively align the transformed features from two modalities. In this paper, we propose two novel techniques: InverseAug that inverses geometric-related augmentations, e.g., rotation, to enable accurate geometric alignment between lidar points and image pixels, and LearnableAlign that leverages cross-attention to dynamically capture the correlations between image and lidar features during fusion. Based on InverseAug and LearnableAlign, we develop a family of generic multi-modal 3D detection models named DeepFusion, which is more accurate than previous methods. For example, DeepFusion improves Point-Pillars, CenterPoint, and 3D-MAN baselines on Pedestrian detection for 6.7,8.9, and 6.2 LEVEL_2 APH, respectively. Notably, our models achieve state-of-the-art performance on Waymo Open Dataset, and show strong model robustness against input corruptions and out-of-distribution data. Code will be publicly available at https://github.com/tensorflow/lingvo.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
10秒前
19秒前
英俊的铭应助lvlv采纳,获得10
20秒前
凶残小白兔完成签到 ,获得积分10
27秒前
Tonsil01发布了新的文献求助30
27秒前
29秒前
lvlv发布了新的文献求助10
34秒前
Owen应助不能随便采纳,获得10
34秒前
戴U完成签到,获得积分10
41秒前
CipherSage应助Huang采纳,获得10
41秒前
45秒前
不能随便发布了新的文献求助10
49秒前
酷波er应助小文要更优秀采纳,获得10
1分钟前
田様应助恶恶么v采纳,获得10
1分钟前
1分钟前
1分钟前
qq发布了新的文献求助50
1分钟前
1分钟前
Leo完成签到 ,获得积分10
1分钟前
morena发布了新的文献求助10
1分钟前
一夏完成签到,获得积分10
1分钟前
1分钟前
堪曼凝发布了新的文献求助10
1分钟前
小马甲应助不能随便采纳,获得10
1分钟前
Owen应助小文要更优秀采纳,获得10
1分钟前
抠鼻公主完成签到 ,获得积分10
1分钟前
1分钟前
小鸟芋圆露露完成签到 ,获得积分10
1分钟前
恶恶么v发布了新的文献求助10
1分钟前
小牛牛发布了新的文献求助10
1分钟前
1分钟前
Huang发布了新的文献求助10
1分钟前
2分钟前
monicaj完成签到 ,获得积分10
2分钟前
2分钟前
2分钟前
袁粪到了完成签到 ,获得积分10
2分钟前
Tonsil01发布了新的文献求助30
2分钟前
2分钟前
欣喜的代容完成签到 ,获得积分10
2分钟前
高分求助中
请在求助之前详细阅读求助说明!!!! 20000
Sphäroguß als Werkstoff für Behälter zur Beförderung, Zwischen- und Endlagerung radioaktiver Stoffe - Untersuchung zu alternativen Eignungsnachweisen: Zusammenfassender Abschlußbericht 1500
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 1000
Yuwu Song, Biographical Dictionary of the People's Republic of China 700
[Lambert-Eaton syndrome without calcium channel autoantibodies] 520
The Three Stars Each: The Astrolabes and Related Texts 500
A radiographic standard of reference for the growing knee 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2468118
求助须知:如何正确求助?哪些是违规求助? 2136051
关于积分的说明 5442488
捐赠科研通 1860640
什么是DOI,文献DOI怎么找? 925418
版权声明 562675
科研通“疑难数据库(出版商)”最低求助积分说明 495078