Underwater Image Captioning With AquaSketch-Enhanced Cross-Scale Information Fusion

隐藏字幕 水下 图像融合 计算机科学 计算机视觉 比例(比率) 遥感 人工智能 图像(数学) 地质学 地理 海洋学 地图学
作者
Huanyu Li,Li Li,Hao Wang,Weibo Zhang,Peng Ren
出处
期刊:IEEE Transactions on Geoscience and Remote Sensing [Institute of Electrical and Electronics Engineers]
卷期号:63: 1-18 被引量:28
标识
DOI:10.1109/tgrs.2025.3585119
摘要

Underwater image captioning bridges the gap between visual perception and semantic understanding of underwater scenes, playing a crucial role in applications such as ocean geoscience and underwater remote sensing. Despite progress in this field, limitations remain in achieving accurate underwater image captioning. The main limitations are: (a) the underestimation of basic sketch features in underwater image captioning, and (b) insufficient consideration of the impact of scale differences in underwater objects. To overcome these limitations, we propose underwater image captioning with AquaSketch enhanced cross-scale information fusion. Our novel contributions are twofold: (a) A novel AquaSketch (i.e., aqua sketch) enhancement method is developed to reduce the impact of underwater image distortion on scene understanding, while enhancing both detailed and background information; and (b) A top-down dual-branch pyramid for cross-scale information fusion is proposed. This architecture fuses multi-scale feature information from two branches through an attention-based feature fusion structure, performing cross-scale fusion in a top-down manner. The resulting pyramid fusion features offer a comprehensive representation of underwater object information. Collectively, these contributions facilitate the generation of accurate and comprehensive underwater image captions. Experimental evaluations on three datasets demonstrate that our proposed underwater image captioning model achieves state-of-the-art performance in the field.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
my发布了新的文献求助10
1秒前
yjstar发布了新的文献求助10
1秒前
大模型应助bai采纳,获得10
1秒前
不安的乞发布了新的文献求助10
1秒前
是风动完成签到 ,获得积分10
1秒前
2秒前
彭于晏应助起名太难了采纳,获得10
2秒前
2秒前
Bebetter完成签到,获得积分10
3秒前
无敌发布了新的文献求助10
3秒前
甜菜完成签到,获得积分10
4秒前
Cristal完成签到,获得积分10
4秒前
5秒前
6秒前
tz发布了新的文献求助10
6秒前
7秒前
7秒前
7秒前
xxszyb完成签到,获得积分10
7秒前
科研通AI6.3应助my采纳,获得10
8秒前
斯文败类应助亲爱的葡萄采纳,获得10
9秒前
汝桢发布了新的文献求助10
9秒前
10秒前
呆妞完成签到,获得积分10
10秒前
NexusExplorer应助Yan采纳,获得10
10秒前
10秒前
秦屿完成签到,获得积分10
10秒前
jjh完成签到,获得积分20
11秒前
哎哟大侠发布了新的文献求助10
11秒前
研友_VZG7GZ应助nnn25采纳,获得10
11秒前
踏实的酸奶完成签到,获得积分10
12秒前
木象爱火锅完成签到,获得积分10
12秒前
呋喃完成签到,获得积分10
12秒前
12秒前
燃尔发布了新的文献求助10
12秒前
猰貐发布了新的文献求助10
12秒前
一小朵完成签到,获得积分20
12秒前
xiadongbj完成签到,获得积分10
13秒前
稻草人完成签到,获得积分10
13秒前
高分求助中
Malcolm Fraser : a biography 700
Signals, Systems, and Signal Processing 610
天津市智库成果选编 600
Climate change and sports: Statistics report on climate change and sports 500
Forced degradation and stability indicating LC method for Letrozole: A stress testing guide 500
Organic Reactions Volume 118 400
A Foreign Missionary on the Long March: The Unpublished Memoirs of Arnolis Hayman of the China Inland Mission 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6462449
求助须知:如何正确求助?哪些是违规求助? 8270506
关于积分的说明 17630729
捐赠科研通 5533837
什么是DOI,文献DOI怎么找? 2906746
邀请新用户注册赠送积分活动 1883600
关于科研通互助平台的介绍 1730136