A Patch-Level Region-Aware Module with a Multi-Label Framework for Remote Sensing Image Captioning

隐藏字幕 计算机科学 遥感 图像(数学) 计算机视觉 地质学
作者
Yunpeng Li,Xiangrong Zhang,Tianyang Zhang,Guanchun Wang,Xinlin Wang,Shuo Li
出处
期刊:Remote Sensing [Multidisciplinary Digital Publishing Institute]
卷期号:16 (21): 3987-3987 被引量:2
标识
DOI:10.3390/rs16213987
摘要

Recent Transformer-based works can generate high-quality captions for remote sensing images (RSIs). However, these methods generally feed global or grid visual features to a Transformer-based captioning model for associating cross-modal information, which limits performance. In this work, we investigate unexplored ideas for remote sensing image captioning task, using a novel patch-level region-aware module with a multi-label framework. Due to an overhead perspective and a significantly larger scale in RSIs, a patch-level region-aware module is designed to filter the redundant information in the RSI scene, which benefits the Transformer-based decoder by attaining improved image perception. Technically, the trainable multi-label classifier capitalizes on semantic features as supplementary to the region-aware features. Moreover, modeling the inner relations of inputs is essential for understanding the RSI. Thus, we introduce region-oriented attention, which associates region features and semantic labels, omits the irrelevant regions to highlight relevant regions, and learns related semantic information. Extensive qualitative and quantitative experimental results show the superiority of our approach on the RSICD, UCM-Captions, and Sydney-Captions. The code for our method will be publicly available.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
xixi完成签到,获得积分10
刚刚
mafukairi发布了新的文献求助30
1秒前
糟糕的铁锤完成签到,获得积分0
2秒前
科研通AI2S应助oguricap采纳,获得10
2秒前
一只刺豚发布了新的文献求助30
2秒前
dde应助QJN采纳,获得10
3秒前
碧蓝靳完成签到,获得积分20
4秒前
4秒前
在水一方应助月来越好采纳,获得10
5秒前
小橘子吃傻子完成签到,获得积分10
5秒前
5秒前
赘婿应助阿达采纳,获得10
7秒前
馥桉樊发布了新的文献求助10
7秒前
smile发布了新的文献求助10
8秒前
8秒前
书中日月长完成签到,获得积分10
9秒前
iiii发布了新的文献求助10
10秒前
wanci应助lulu采纳,获得30
10秒前
完美世界应助涵忆采纳,获得10
10秒前
852应助黄凯采纳,获得10
11秒前
11秒前
11秒前
11秒前
研友_Ze2V48完成签到,获得积分10
12秒前
张天泽完成签到,获得积分10
14秒前
silence完成签到,获得积分10
14秒前
14秒前
15秒前
段段发布了新的文献求助30
16秒前
小水滴发布了新的文献求助10
16秒前
奎奎完成签到 ,获得积分10
17秒前
18秒前
椰椰完成签到,获得积分10
18秒前
李昕123发布了新的文献求助80
18秒前
20秒前
20秒前
阿达发布了新的文献求助10
20秒前
21秒前
22秒前
gchgcv完成签到,获得积分10
22秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
晶种分解过程与铝酸钠溶液混合强度关系的探讨 8888
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Leading Academic-Practice Partnerships in Nursing and Healthcare: A Paradigm for Change 800
Signals, Systems, and Signal Processing 610
The Sage Handbook of Digital Labour 600
The formation of Australian attitudes towards China, 1918-1941 600
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6417989
求助须知:如何正确求助?哪些是违规求助? 8237421
关于积分的说明 17499526
捐赠科研通 5470734
什么是DOI,文献DOI怎么找? 2890296
邀请新用户注册赠送积分活动 1867157
关于科研通互助平台的介绍 1704229