Lightweight and Accurate Multi-View Stereo With Confidence-Aware Diffusion Model

计算机科学 点云 扩散 判别式 噪音(视频) 过程(计算) 人工智能 保险丝(电气) 降噪 扩散过程 编码器 样品(材料) 算法 计算机视觉 图像(数学) 物理 工程类 电气工程 操作系统 热力学 知识管理 化学 色谱法 创新扩散
作者
Fangjinhua Wang,Qingshan Xu,Yew-Soon Ong,Marc Pollefeys
出处
期刊:IEEE Transactions on Pattern Analysis and Machine Intelligence [IEEE Computer Society]
卷期号:47 (11): 10060-10075 被引量:3
标识
DOI:10.1109/tpami.2025.3597148
摘要

To reconstruct the 3D geometry from calibrated images, learning-based multi-view stereo (MVS) methods typically perform multi-view depth estimation and then fuse depth maps into a mesh or point cloud. To improve the computational efficiency, many methods initialize a coarse depth map and then gradually refine it in higher resolutions. Recently, diffusion models achieve great success in generation tasks. Starting from a random noise, diffusion models gradually recover the sample with an iterative denoising process. In this paper, we propose a novel MVS framework, which introduces diffusion models in MVS. Specifically, we formulate depth refinement as a conditional diffusion process. Considering the discriminative characteristic of depth estimation, we design a condition encoder to guide the diffusion process. To improve efficiency, we propose a novel diffusion network combining lightweight 2D U-Net and convolutional GRU. Moreover, we propose a novel confidence-based sampling strategy to adaptively sample depth hypotheses based on the confidence estimated by diffusion model. Based on our novel MVS framework, we propose two novel MVS methods, DiffMVS and CasDiffMVS. DiffMVS achieves competitive performance with state-of-the-art efficiency in run-time and GPU memory. CasDiffMVS achieves state-of-the-art performance on DTU, Tanks & Temples and ETH3D.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
CipherSage应助小透明采纳,获得10
1秒前
Hello应助小透明采纳,获得10
1秒前
1秒前
酷波er应助小透明采纳,获得30
1秒前
sagitar应助小透明采纳,获得50
1秒前
桐桐应助小透明采纳,获得10
2秒前
小二郎应助小透明采纳,获得10
2秒前
科研通AI6.1应助小透明采纳,获得30
2秒前
科研通AI6.1应助小透明采纳,获得10
2秒前
Jasper应助小透明采纳,获得30
2秒前
cdercder应助小透明采纳,获得10
2秒前
可知蝶恋花完成签到,获得积分20
3秒前
山山而川发布了新的文献求助10
4秒前
4秒前
1111完成签到,获得积分10
4秒前
无极微光应助晞晞采纳,获得20
5秒前
7秒前
无花果应助可知蝶恋花采纳,获得10
7秒前
Stone发布了新的文献求助10
7秒前
7秒前
文文文完成签到,获得积分10
7秒前
szl发布了新的文献求助10
7秒前
8秒前
悦耳豪完成签到,获得积分10
8秒前
姜汁树完成签到 ,获得积分10
9秒前
10秒前
今未完成签到,获得积分10
10秒前
赘婿应助songf11采纳,获得10
11秒前
11秒前
lscpp发布了新的文献求助10
12秒前
molihuakai应助aa121599采纳,获得10
13秒前
oh完成签到,获得积分10
14秒前
szl完成签到,获得积分20
14秒前
我口中说的永远完成签到 ,获得积分10
15秒前
16秒前
16秒前
16秒前
发发发布了新的文献求助10
16秒前
糯米应助蒲云海采纳,获得10
17秒前
轨迹发布了新的文献求助10
17秒前
高分求助中
Ideology and Meaning-Making under the Putin Regime 750
Introduction to Industrial/Organizational Psychology 600
Prompt Engineering for Clinicians: Harnessing AI in Everyday Medical Practice 600
Handbook of Luminescence Dating 500
Safety Pharmacology 500
《KNN基无铅压电陶瓷电学性能优化与物理机理研究》 500
Isomerism In Coordination Compounds 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 计算机科学 化学工程 生物化学 物理 内科学 复合材料 催化作用 光电子学 物理化学 电极 细胞生物学 基因 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6936668
求助须知:如何正确求助?哪些是违规求助? 8623133
关于积分的说明 18289991
捐赠科研通 6365089
什么是DOI,文献DOI怎么找? 3075751
关于科研通互助平台的介绍 2113821
邀请新用户注册赠送积分活动 2053166