Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data

计算机科学 一般化 公制(单位) 集合(抽象数据类型) 单眼 人工智能 比例(比率) 数据集 简单(哲学) 编码器 杠杆(统计) 缩放比例 机器学习 数据挖掘 数学分析 哲学 运营管理 物理 几何学 数学 认识论 量子力学 经济 程序设计语言 操作系统
作者
Lihe Yang,Bingyi Kang,Zibin Huang,Xiaogang Xu,Jiashi Feng,Hengshuang Zhao
出处
期刊:Cornell University - arXiv 被引量:1
标识
DOI:10.48550/arxiv.2401.10891
摘要

This work presents Depth Anything, a highly practical solution for robust monocular depth estimation. Without pursuing novel technical modules, we aim to build a simple yet powerful foundation model dealing with any images under any circumstances. To this end, we scale up the dataset by designing a data engine to collect and automatically annotate large-scale unlabeled data (~62M), which significantly enlarges the data coverage and thus is able to reduce the generalization error. We investigate two simple yet effective strategies that make data scaling-up promising. First, a more challenging optimization target is created by leveraging data augmentation tools. It compels the model to actively seek extra visual knowledge and acquire robust representations. Second, an auxiliary supervision is developed to enforce the model to inherit rich semantic priors from pre-trained encoders. We evaluate its zero-shot capabilities extensively, including six public datasets and randomly captured photos. It demonstrates impressive generalization ability. Further, through fine-tuning it with metric depth information from NYUv2 and KITTI, new SOTAs are set. Our better depth model also results in a better depth-conditioned ControlNet. Our models are released at https://github.com/LiheYoung/Depth-Anything.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
QIN123456完成签到,获得积分10
3秒前
忐忑的远山应助。。采纳,获得10
4秒前
打打应助1212采纳,获得10
6秒前
个性的紫菜应助苹果蝴蝶采纳,获得10
6秒前
从南到北发布了新的文献求助10
7秒前
孙皮皮完成签到,获得积分10
9秒前
Lucas应助曲听安采纳,获得10
10秒前
潘榆完成签到,获得积分10
13秒前
英俊的铭应助郭生采纳,获得10
14秒前
阳佟半仙完成签到,获得积分10
14秒前
YuuuY完成签到 ,获得积分10
17秒前
yan完成签到 ,获得积分10
18秒前
从南到北完成签到,获得积分10
19秒前
orixero应助DullElm采纳,获得10
19秒前
申木完成签到 ,获得积分10
20秒前
打打应助浅若夏沫采纳,获得10
21秒前
YuuuY关注了科研通微信公众号
23秒前
23秒前
彭于晏应助正直凌文采纳,获得10
23秒前
24秒前
科目三应助郭生采纳,获得10
24秒前
yanshenshen完成签到 ,获得积分0
26秒前
27秒前
27秒前
27秒前
如如发布了新的文献求助10
28秒前
lamourpp完成签到,获得积分20
28秒前
Cwx2020完成签到,获得积分10
28秒前
情怀应助谦让的樱采纳,获得10
29秒前
30秒前
huang发布了新的文献求助10
30秒前
顺shun完成签到,获得积分10
31秒前
俺嫩爹发布了新的文献求助10
31秒前
32秒前
猪头军师发布了新的文献求助10
32秒前
33秒前
酸化土壤改良应助charles采纳,获得10
33秒前
33秒前
22发布了新的文献求助10
33秒前
33秒前
高分求助中
Manual of Clinical Microbiology, 4 Volume Set (ASM Books) 13th Edition 1000
Sport in der Antike 800
De arte gymnastica. The art of gymnastics 600
Berns Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
Stephen R. Mackinnon - Chen Hansheng: China’s Last Romantic Revolutionary (2023) 500
Sport in der Antike Hardcover – March 1, 2015 500
Boris Pesce - Gli impiegati della Fiat dal 1955 al 1999 un percorso nella memoria 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2422479
求助须知:如何正确求助?哪些是违规求助? 2111686
关于积分的说明 5346219
捐赠科研通 1839196
什么是DOI,文献DOI怎么找? 915538
版权声明 561205
科研通“疑难数据库(出版商)”最低求助积分说明 489669