UMIS-YOLO: Underwater Multimodal Images Instance Segmentation With YOLO

人工智能 计算机科学 分割 计算机视觉 图像分割 水下 RGB颜色模型 合成孔径雷达 尺度空间分割 特征提取 基于分割的对象分类 模式识别(心理学) 特征(语言学) 卷积神经网络 稳健性(进化) 残余物 深度学习 频域 人工神经网络 合并(版本控制)
作者
Yue Yang,Xiaoyi Feng,Ming Li,Xiangyun Hu,Jiangying Qin,Armin Gruen,Deren Li,Jianya Gong
出处
期刊:IEEE Transactions on Geoscience and Remote Sensing [Institute of Electrical and Electronics Engineers]
卷期号:63: 1-14 被引量:1
标识
DOI:10.1109/tgrs.2025.3618269
摘要

Underwater instance segmentation plays a pivotal role in various applications. Among them, coral instance segmentation is of great significance in the fields of marine biology and environmental monitoring, and is crucial for comprehensive understanding of coral reef ecosystems. Traditional methods for underwater instance segmentation predominantly rely on RGB images. However, the complex morphology of corals and strong background interference often result in poor segmentation outcomes. To tackle these problems, this study presents a novel multimodal instance segmentation method, termed UMIS-YOLO, which is grounded in the YOLO architecture. UMIS-YOLO incorporates a dual backbone network design that substantially enhances the feature extraction capabilities for both RGB images and depth images, thereby improving the effectiveness of instance segmentation. At the same time, we propose two innovative plug-and-play modules: the Frequency Domain Feature Enhancement Fusion (FDFEF) module and the Residual Feature Fusion (RFF) module. The FDFEF module leverages Fourier transform to enhance the features of both modalities in the frequency domain, employing learnable weights to enable the complementary integration of amplitude and phase information. While the RFF module utilizes a residual learning strategy to efficiently merge low-level and high-level features prior to the segmentation head, thereby improving pixel-level segmentation accuracy. Additionally, we introduce a challenging high-resolution dataset, UMIS-Coral, which comprises RGB images and depth images captured in complex coral environments. Meanwhile, we expand the depth images for the UIIS dataset to further verify the effectiveness of UMIS-YOLO. The experimental results indicate that the UMIS-YOLO model achieved mAP50 and mAP75 improvements of 2.3 and 3.0 on the UMIS-Coral dataset, as well as 3.9 and 2.8 on the UIIS dataset, respectively. Furthermore, the model is characterized by its lightweight architecture and rapid segmentation capabilities. The source code and the dataset are publicly accessible at https://github.com/zhangsanhulk/UMIS-YOLO.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
YONG完成签到,获得积分10
1秒前
洗刷刷发布了新的文献求助10
1秒前
张德彪发布了新的文献求助30
2秒前
2秒前
Adalwolf发布了新的文献求助10
3秒前
soosoo发布了新的文献求助10
5秒前
CFD应助帆帆采纳,获得10
6秒前
浅浅殇完成签到,获得积分10
7秒前
Xue完成签到 ,获得积分10
7秒前
YONG完成签到,获得积分10
7秒前
如何让人发布了新的文献求助10
10秒前
11秒前
孟斯扬完成签到,获得积分10
13秒前
流沙完成签到,获得积分10
13秒前
15秒前
小哲完成签到,获得积分10
16秒前
19秒前
南城风发布了新的文献求助10
20秒前
爱吃简便泡菜的小智完成签到 ,获得积分10
24秒前
柒柒完成签到,获得积分10
25秒前
hdhuang完成签到,获得积分10
29秒前
万能图书馆应助Adalwolf采纳,获得10
29秒前
树袋熊和考拉完成签到,获得积分10
29秒前
清寒完成签到,获得积分10
30秒前
NexusExplorer应助lyyy采纳,获得10
30秒前
Seagull完成签到,获得积分10
30秒前
受伤访波完成签到,获得积分10
33秒前
马大帅发布了新的文献求助10
38秒前
心灵美复天完成签到,获得积分10
41秒前
42秒前
佘佘宇杰完成签到,获得积分10
42秒前
草原狼完成签到,获得积分10
43秒前
qyang完成签到 ,获得积分10
44秒前
kelly完成签到,获得积分10
44秒前
zyw完成签到 ,获得积分10
44秒前
情怀应助撒西不理采纳,获得10
46秒前
Glacier发布了新的文献求助10
46秒前
近代完成签到,获得积分10
47秒前
47秒前
高分求助中
论现代体育科学研究的方法学特征 1000
Invited Discussant 63O and 64O 1000
Ideology and Meaning-Making under the Putin Regime 750
Safety Pharmacology 500
《KNN基无铅压电陶瓷电学性能优化与物理机理研究》 500
Petrology and Plate Tectonics 500
A Handbook of User Experience Research & Design in Libraries 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 计算机科学 化学工程 生物化学 物理 内科学 复合材料 催化作用 光电子学 物理化学 电极 细胞生物学 基因 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6914660
求助须知:如何正确求助?哪些是违规求助? 8606393
关于积分的说明 18261156
捐赠科研通 6326215
什么是DOI,文献DOI怎么找? 3067887
关于科研通互助平台的介绍 2095334
邀请新用户注册赠送积分活动 2045203