Direction-Oriented Visual–Semantic Embedding Model for Remote Sensing Image–Text Retrieval

计算机科学 图像检索 嵌入 视觉文字 人工智能 遥感 情报检索 图像(数学) 可视化 计算机视觉 地质学
作者
Qing Ma,Jiancheng Pan,Cong Bai
出处
期刊:IEEE Transactions on Geoscience and Remote Sensing [Institute of Electrical and Electronics Engineers]
卷期号:62: 1-14 被引量:8
标识
DOI:10.1109/tgrs.2024.3392779
摘要

Image-text retrieval has developed rapidly in recent years. However, it is still a challenge in remote sensing due to visual-semantic imbalance, which leads to incorrect matching of non-semantic visual and textual features. To solve this problem, we propose a novel Direction-Oriented Visual-semantic Embedding Model (DOVE) to mine the relationship between vision and language. Our highlight is to conduct visual and textual representations in latent space, directing them as close as possible to a redundancy-free regional visual representation. Concretely, a Regional-Oriented Attention Module (ROAM) adaptively adjusts the distance between the final visual and textual embeddings in the latent semantic space, oriented by regional visual features. Meanwhile, a lightweight Digging Text Genome Assistant (DTGA) is designed to expand the range of tractable textual representation and enhance global word-level semantic connections using less attention operations. Ultimately, we exploit a global visual-semantic constraint to reduce single visual dependency and serve as an external constraint for the final visual and textual representations. The effectiveness and superiority of our method are verified by extensive experiments including parameter evaluation, quantitative comparison, ablation studies and visual analysis, on two benchmark datasets, RSICD and RSITMD.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
脑洞疼应助elle采纳,获得10
1秒前
3秒前
jhxie发布了新的文献求助10
5秒前
666完成签到 ,获得积分10
7秒前
在九月完成签到 ,获得积分10
16秒前
无一完成签到 ,获得积分10
19秒前
sisii发布了新的文献求助10
22秒前
努力搬砖努力干完成签到,获得积分10
22秒前
22秒前
科研小虫发布了新的文献求助10
26秒前
jhxie完成签到,获得积分10
28秒前
31秒前
ipcy完成签到 ,获得积分10
34秒前
昀宇完成签到 ,获得积分10
37秒前
沙珠完成签到,获得积分10
38秒前
王志鹏完成签到 ,获得积分10
40秒前
chenying完成签到 ,获得积分0
40秒前
一路有你完成签到 ,获得积分10
43秒前
32429606完成签到 ,获得积分10
44秒前
霓娜酱完成签到 ,获得积分10
45秒前
xfy完成签到,获得积分10
46秒前
付付完成签到 ,获得积分10
46秒前
嘟嘟雯完成签到 ,获得积分10
48秒前
细腻无春完成签到 ,获得积分10
50秒前
Wu完成签到 ,获得积分10
53秒前
科研通AI2S应助科研通管家采纳,获得10
54秒前
标致幻然完成签到 ,获得积分10
54秒前
知否完成签到 ,获得积分0
55秒前
baoxiaozhai完成签到 ,获得积分10
56秒前
KLED完成签到 ,获得积分10
1分钟前
1分钟前
儒雅龙完成签到 ,获得积分10
1分钟前
狗狗完成签到 ,获得积分10
1分钟前
大个应助科研小虫采纳,获得10
1分钟前
挖挖机完成签到 ,获得积分10
1分钟前
1分钟前
三伏天完成签到,获得积分10
1分钟前
沧海云完成签到 ,获得积分10
1分钟前
盛宇大天才完成签到,获得积分10
1分钟前
高分求助中
Thinking Small and Large 500
Algorithmic Mathematics in Machine Learning 500
Getting Published in SSCI Journals: 200+ Questions and Answers for Absolute Beginners 300
The Monocyte-to-HDL ratio (MHR) as a prognostic and diagnostic biomarker in Acute Ischemic Stroke: A systematic review with meta-analysis (P9-14.010) 240
Interpretability and Explainability in AI Using Python 200
SPECIAL FEATURES OF THE EXCHANGE INTERACTIONS IN ORTHOFERRITE-ORTHOCHROMITES 200
Null Objects from a Cross-Linguistic and Developmental Perspective 200
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3833919
求助须知:如何正确求助?哪些是违规求助? 3376342
关于积分的说明 10492666
捐赠科研通 3095877
什么是DOI,文献DOI怎么找? 1704767
邀请新用户注册赠送积分活动 820104
科研通“疑难数据库(出版商)”最低求助积分说明 771859