Weakly-Supervised RGBD Video Object Segmentation

人工智能 最小边界框 计算机视觉 分割 计算机科学 跳跃式监视 注释 水准点(测量) 推论 对象(语法) 模式识别(心理学) 图像(数学) 大地测量学 地理
作者
Jeong-Seok Yang,Mingqi Gao,Feng Zheng,Xiantong Zhen,Rongrong Ji,Ling Shao,Aleš Leonardis
出处
期刊:IEEE transactions on image processing [Institute of Electrical and Electronics Engineers]
卷期号:33: 2158-2170
标识
DOI:10.1109/tip.2024.3374130
摘要

Depth information opens up new opportunities for video object segmentation (VOS) to be more accurate and robust in complex scenes. However, the RGBD VOS task is largely unexplored due to the expensive collection of RGBD data and time-consuming annotation of segmentation. In this work, we first introduce a new benchmark for RGBD VOS, named DepthVOS, which contains 350 videos (over 55k frames in total) annotated with masks and bounding boxes. We futher propose a novel, strong baseline model - Fused Color-Depth Network (FusedCDNet), which can be trained solely under the supervision of bounding boxes, while being used to generate masks with a bounding box guideline only in the first frame. Thereby, the model possesses three major advantages: a weakly-supervised training strategy to overcome the high-cost annotation, a cross-modal fusion module to handle complex scenes, and weakly-supervised inference to promote ease of use. Extensive experiments demonstrate that our proposed method performs on par with top fully-supervised algorithms. We will open-source our project on https://github.com/yjybuaa/depthvos/ to facilitate the development of RGBD VOS.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Big-Mom完成签到 ,获得积分10
1秒前
1秒前
小夏完成签到 ,获得积分10
3秒前
3秒前
易相逢发布了新的文献求助10
3秒前
嵇南露发布了新的文献求助10
4秒前
5秒前
5秒前
YY发布了新的文献求助10
6秒前
6秒前
huangsi发布了新的文献求助10
9秒前
GZJ发布了新的文献求助10
9秒前
李小木子发布了新的文献求助10
11秒前
12秒前
负责的兔子完成签到,获得积分10
12秒前
CYP450发布了新的文献求助10
13秒前
蝼蚁王完成签到 ,获得积分10
13秒前
YY完成签到,获得积分10
16秒前
cjj完成签到,获得积分10
16秒前
可爱迪应助huangsi采纳,获得10
16秒前
可爱迪应助huangsi采纳,获得10
16秒前
大模型应助huangsi采纳,获得10
16秒前
18秒前
20秒前
20秒前
25秒前
30秒前
脑洞疼应助科研通管家采纳,获得10
30秒前
科目三应助科研通管家采纳,获得10
30秒前
30秒前
领导范儿应助科研通管家采纳,获得10
30秒前
文艺的冬卉完成签到,获得积分10
30秒前
空古悠浪发布了新的文献求助10
30秒前
33秒前
33秒前
FlightAttendant应助yu采纳,获得10
34秒前
端庄磬完成签到,获得积分20
36秒前
gc发布了新的文献求助10
36秒前
望轲完成签到 ,获得积分10
36秒前
领导范儿应助山娃子采纳,获得10
36秒前
高分求助中
Manual of Clinical Microbiology, 4 Volume Set (ASM Books) 13th Edition 1000
Sport in der Antike 800
De arte gymnastica. The art of gymnastics 600
少脉山油柑叶的化学成分研究 530
Electronic Structure Calculations and Structure-Property Relationships on Aromatic Nitro Compounds 500
Berns Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
Stephen R. Mackinnon - Chen Hansheng: China’s Last Romantic Revolutionary (2023) 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2414455
求助须知:如何正确求助?哪些是违规求助? 2107845
关于积分的说明 5328864
捐赠科研通 1835070
什么是DOI,文献DOI怎么找? 914378
版权声明 561017
科研通“疑难数据库(出版商)”最低求助积分说明 488942