已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Rare-aware attention network for image–text matching

计算机科学 代表(政治) 匹配(统计) 图像(数学) 注意力网络 情报检索 相似性(几何) 人工智能 隐藏字幕 利用 模式识别(心理学) 自然语言处理 数据挖掘 统计 政治 计算机安全 法学 数学 政治学
作者
Yan Wang,Yuting Su,Wenhui Li,Zhengya Sun,Zhiqiang Wei,Jie Nie,Xuanya Li,An-An Liu
出处
期刊:Information Processing and Management [Elsevier BV]
卷期号:60 (3): 103280-103280 被引量:3
标识
DOI:10.1016/j.ipm.2023.103280
摘要

Image and text matching bridges visual and textual modality differences and plays a considerable role in cross-modal retrieval. Much progress has been achieved through semantic representation and alignment. However, the distribution of multimedia data is severely unbalanced and contains many low-frequency occurrences, which are often ignored and cause performance degradation, i.e., the long-tail effect. In this work, we propose a novel rare-aware attention network (RAAN), which explores and exploits textual rare content for tackling the long-tail effect of image and text matching. Specifically, we first design a rare-aware mining module, which contains global prior information construction and rare fragment detector for modeling the characteristic of rare content. Then, the rare attention matching utilizes prior information as attention to guide the representation enhancement of rare content and introduces the rareness representation to strengthen the similarity calculation. Finally, we design prior information loss to optimize the model together with the triplet loss. We perform quantitative and qualitative experiments on two large-scale databases and achieve leading performance. In particular, we conduct 0-shot test for rare content and improve rSum by 21.0 and 41.5 on Flickr30K (155,000 image and text pairs) and MSCOCO (616,435 image and text pairs), demonstrating the effectiveness of the proposed method for the long-tail effect.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
脑洞疼应助ccm采纳,获得10
1秒前
3秒前
Lucas应助妖精采纳,获得10
5秒前
辉月发布了新的文献求助10
5秒前
在水一方应助喜悦的秋双采纳,获得10
7秒前
7秒前
7秒前
8秒前
nicheng发布了新的文献求助10
8秒前
changping应助cmu1h采纳,获得10
9秒前
别当真完成签到 ,获得积分10
9秒前
10秒前
科研通AI5应助Sula37采纳,获得30
11秒前
12秒前
mkmimii发布了新的文献求助10
12秒前
13秒前
叶协琪发布了新的文献求助10
13秒前
辉月完成签到,获得积分10
16秒前
Feng5945完成签到 ,获得积分10
16秒前
euy发布了新的文献求助10
17秒前
17秒前
所所应助谦让的啤酒采纳,获得10
18秒前
19秒前
20秒前
21秒前
21秒前
老实的黑米完成签到 ,获得积分10
22秒前
瘦瘦小丸子完成签到,获得积分10
25秒前
cami11a完成签到 ,获得积分10
25秒前
25秒前
Jy发布了新的文献求助10
26秒前
喜悦的秋双给喜悦的秋双的求助进行了留言
26秒前
26秒前
26秒前
keke完成签到 ,获得积分10
30秒前
Xian完成签到 ,获得积分10
30秒前
蕊蕊发布了新的文献求助10
31秒前
大白发布了新的文献求助10
31秒前
田様应助Miranda采纳,获得10
32秒前
32秒前
高分求助中
Pipeline and riser loss of containment 2001 - 2020 (PARLOC 2020) 1000
哈工大泛函分析教案课件、“72小时速成泛函分析:从入门到入土.PDF”等 660
Comparing natural with chemical additive production 500
The Leucovorin Guide for Parents: Understanding Autism’s Folate 500
Phylogenetic study of the order Polydesmida (Myriapoda: Diplopoda) 500
A Manual for the Identification of Plant Seeds and Fruits : Second revised edition 500
The Social Work Ethics Casebook: Cases and Commentary (revised 2nd ed.) 400
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 5209140
求助须知:如何正确求助?哪些是违规求助? 4386469
关于积分的说明 13660937
捐赠科研通 4245610
什么是DOI,文献DOI怎么找? 2329382
邀请新用户注册赠送积分活动 1327206
关于科研通互助平台的介绍 1279519