Uncertainty-Guided Diffusion Model for Camouflaged Object Detection

计算机科学 人工智能 扩散 对象(语法) 数据挖掘 计算机视觉 热力学 物理
作者
Jinsheng Yang,Bineng Zhong,Qihua Liang,Zhiyi Mo,Shengping Zhang,Shuxiang Song
出处
期刊:IEEE Transactions on Multimedia [Institute of Electrical and Electronics Engineers]
卷期号:27: 4656-4669 被引量:2
标识
DOI:10.1109/tmm.2025.3535290
摘要

Recently, diffusion models have significantly improved the performance of Camouflaged Object Detection (COD) by adding noise to a mask and iteratively denoising it to match the target distributions. Due to the direct extraction of features from noisy masks and the lack of conditional constraints on a prediction area, the diffusion model may deviate from a correct prediction range and produces mispredictions in regions with high uncertainty. To address this issue, we propose an uncertainty-guided diffusion model (UGDNet) for COD, which explicitly quantifies uncertainty and integrates it as an anchor condition into the diffusion models to provide an initialization of the diffusion regions. The core idea is first to utilize a probability representation and transformer to explicitly model uncertainty, aiming to identify areas where a model may generate overconfident mispredictions. Then, we use the uncertainty as an anchor condition to provide a reference prediction range for the diffusion model, guiding each step of the diffusion process. Furthermore, we use uncertainty to guide feature aggregation, prompting the model to pay extra attention to the semantic features of regions with high uncertainty to refine the segmentation results further. The experimental results indicate that our proposed UGDNet achieves higher accuracy than existing state-of-the-art models on five COD benchmarks, including COD10K, NC4K, CAMO, CHAMELEON, and CDS2K.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
浏阳河发布了新的文献求助10
刚刚
Kavin完成签到,获得积分10
刚刚
怡然夏瑶完成签到,获得积分10
1秒前
华仔应助科研通管家采纳,获得10
1秒前
深情安青应助科研通管家采纳,获得10
1秒前
Owen应助科研通管家采纳,获得10
1秒前
小二郎应助科研通管家采纳,获得10
1秒前
浮游应助科研通管家采纳,获得10
1秒前
SciGPT应助科研通管家采纳,获得10
2秒前
molihuakai应助雪白的凡灵采纳,获得10
2秒前
科目三应助科研通管家采纳,获得10
2秒前
丘比特应助科研通管家采纳,获得10
2秒前
Ava应助科研通管家采纳,获得30
2秒前
3秒前
Lucas应助科研通管家采纳,获得10
3秒前
MST发布了新的文献求助10
9秒前
浏阳河完成签到,获得积分10
10秒前
Chip发布了新的文献求助50
10秒前
10秒前
懒YY捉小J发布了新的文献求助10
15秒前
科研通AI6.2应助kelaier采纳,获得10
15秒前
搜集达人应助kelaier采纳,获得10
16秒前
科研通AI6.2应助kelaier采纳,获得10
16秒前
科研通AI6.2应助kelaier采纳,获得10
16秒前
科研通AI6.2应助kelaier采纳,获得10
16秒前
科研通AI6.4应助kelaier采纳,获得10
16秒前
Wenyu完成签到,获得积分10
17秒前
cdercder应助kelaier采纳,获得10
17秒前
科研通AI6.1应助kelaier采纳,获得10
17秒前
田様应助kelaier采纳,获得10
17秒前
ghhhn完成签到,获得积分10
17秒前
17秒前
冷傲书萱完成签到,获得积分10
18秒前
21秒前
王彦霖完成签到 ,获得积分10
21秒前
Dean应助眼睛大的念桃采纳,获得200
22秒前
22秒前
YYJJHH发布了新的文献求助10
23秒前
海海完成签到,获得积分10
24秒前
慕青应助kelaier采纳,获得10
25秒前
高分求助中
液晶指向矢仿真分析数据集 8888
Invited Discussant 63O and 64O 1000
Dr. Dirk Wiechmann on Lingual Orthodontics: Part I 888
Ideology and Meaning-Making under the Putin Regime 750
化工技术经济第五版电子版 500
Petrology and Plate Tectonics 500
Writing Systems 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 计算机科学 化学工程 生物化学 物理 内科学 复合材料 催化作用 光电子学 物理化学 电极 细胞生物学 基因 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6879704
求助须知:如何正确求助?哪些是违规求助? 8579632
关于积分的说明 18229159
捐赠科研通 6262045
什么是DOI,文献DOI怎么找? 3054751
关于科研通互助平台的介绍 2064564
邀请新用户注册赠送积分活动 2032443