A Prior Instruction Representation Framework for Remote Sensing Image-text Retrieval

计算机科学 代表(政治) 特征学习 钥匙(锁) 编码器 人工智能 特征(语言学) 水准点(测量) 噪音(视频) 子空间拓扑 依赖关系(UML) 隐藏字幕 自然语言处理 机器学习 图像(数学) 哲学 大地测量学 操作系统 政治 法学 语言学 地理 计算机安全 政治学
作者
Jiancheng Pan,Qing Ma,Cong Bai
标识
DOI:10.1145/3581783.3612374
摘要

This paper presents a prior instruction representation framework (PIR) for remote sensing image-text retrieval, aimed at remote sensing vision-language understanding tasks to solve the semantic noise problem. Our highlight is the proposal of a paradigm that draws on prior knowledge to instruct adaptive learning of vision and text representations. Concretely, two progressive attention encoder (PAE) structures, Spatial-PAE and Temporal-PAE, are proposed to perform long-range dependency modeling to enhance key feature representation. In vision representation, Vision Instruction Representation (VIR) based on Spatial-PAE exploits the prior-guided knowledge of the remote sensing scene recognition by building a belief matrix to select key features for reducing the impact of semantic noise. In text representation, Language Cycle Attention (LCA) based on Temporal-PAE uses the previous time step to cyclically activate the current time step to enhance text representation capability. A cluster-wise affiliation loss is proposed to constrain the inter-classes and to reduce the semantic confusion zones in the common subspace. Comprehensive experiments demonstrate that using prior knowledge instruction could enhance vision and text representations and could outperform the state-of-the-art methods on two benchmark datasets, RSICD and RSITMD. Codes are available at https://github.com/Zjut-MultimediaPlus/PIR-pytorch.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
姜浩发布了新的文献求助10
1秒前
慢慢的地理人完成签到,获得积分10
1秒前
科研通AI2S应助晨阳采纳,获得10
1秒前
学术机器1发布了新的文献求助10
2秒前
CodeCraft应助XXJ采纳,获得10
3秒前
情怀应助qipengli采纳,获得10
3秒前
小巴德发布了新的文献求助10
4秒前
4秒前
Nemo发布了新的文献求助10
4秒前
天天发布了新的文献求助10
5秒前
情怀应助林钰浩采纳,获得10
6秒前
领导范儿应助哈哈采纳,获得10
6秒前
水深三英尺完成签到,获得积分10
7秒前
amidious完成签到 ,获得积分10
9秒前
9秒前
10秒前
12秒前
12秒前
12秒前
13秒前
13秒前
学术机器1完成签到,获得积分10
14秒前
祥子完成签到,获得积分10
14秒前
keep应助蔫蔫采纳,获得20
14秒前
风趣谷槐完成签到,获得积分10
16秒前
晨阳发布了新的文献求助10
17秒前
17秒前
彭于晏应助邱靖贻采纳,获得10
17秒前
开心谷秋发布了新的文献求助50
18秒前
哈哈哈发布了新的文献求助10
18秒前
小丹发布了新的文献求助10
19秒前
19秒前
19秒前
小仙女212完成签到,获得积分10
20秒前
21秒前
22秒前
炙热的炳完成签到,获得积分10
23秒前
啵啵冰应助个性烙采纳,获得50
23秒前
小仙女212发布了新的文献求助10
23秒前
晨阳完成签到,获得积分20
24秒前
高分求助中
Les Mantodea de Guyane Insecta, Polyneoptera 2500
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 (PDF!) 1000
Technologies supporting mass customization of apparel: A pilot project 450
A Field Guide to the Amphibians and Reptiles of Madagascar - Frank Glaw and Miguel Vences - 3rd Edition 400
China Gadabouts: New Frontiers of Humanitarian Nursing, 1941–51 400
The Healthy Socialist Life in Maoist China, 1949–1980 400
Walking a Tightrope: Memories of Wu Jieping, Personal Physician to China's Leaders 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3787674
求助须知:如何正确求助?哪些是违规求助? 3333313
关于积分的说明 10261091
捐赠科研通 3048951
什么是DOI,文献DOI怎么找? 1673366
邀请新用户注册赠送积分活动 801847
科研通“疑难数据库(出版商)”最低求助积分说明 760369