Composed Image Retrieval via Cross Relation Network With Hierarchical Aggregation Transformer

计算机科学 变压器 图像检索 数据挖掘 关系(数据库) 模式识别(心理学) 情报检索 人工智能 图像(数学) 电压 物理 量子力学
作者
Qu Yang,Mang Ye,Zhaohui Cai,Kehua Su,Bo Du
出处
期刊:IEEE transactions on image processing [Institute of Electrical and Electronics Engineers]
卷期号:32: 4543-4554 被引量:8
标识
DOI:10.1109/tip.2023.3299791
摘要

Composing Text and Image to Image Retrieval (CTI-IR) aims at finding the target image, which matches the query image visually along with the query text semantically. However, existing works ignore the fact that the reference text usually serves multiple functions, e.g., modification and auxiliary. To address this issue, we put forth a unified solution, namely Hierarchical Aggregation Transformer incorporated with Cross Relation Network (CRN). CRN unifies modification and relevance manner in a single framework. This configuration shows broader applicability, enabling us to model both modification and auxiliary text or their combination in triplet relationships simultaneously. Specifically, CRN includes: 1) Cross Relation Network comprehensively captures the relationships of various composed retrieval scenarios caused by two different query text types, allowing a unified retrieval model to designate adaptive combination strategies for flexible applicability; 2) Hierarchical Aggregation Transformer aggregates top-down features with Multi-layer Perceptron (MLP) to overcome the limitations of edge information loss in a window-based multi-stage Transformer. Extensive experiments demonstrate the superiority of the proposed CRN over all three fashion-domain datasets. Code is available at github.com/yan9qu/crn.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Alice完成签到,获得积分10
3秒前
空谷应助csx采纳,获得10
5秒前
Jasper应助XingchuanMa采纳,获得30
6秒前
8秒前
10秒前
11秒前
科研通AI6.2应助zik采纳,获得10
12秒前
fhh完成签到,获得积分10
12秒前
汪哈七发布了新的文献求助10
14秒前
虚幻的白羊完成签到,获得积分10
14秒前
1234qwer完成签到,获得积分20
15秒前
Qqiao完成签到,获得积分10
15秒前
科研通AI6.3应助csx采纳,获得10
18秒前
luogan完成签到,获得积分10
18秒前
molihuakai应助王清水采纳,获得10
19秒前
李爱国应助纯真冷安采纳,获得10
20秒前
22秒前
23秒前
24秒前
yrug44发布了新的文献求助10
26秒前
华仔应助欢喜的跳跳糖采纳,获得10
28秒前
啦啦啦啦啦完成签到,获得积分10
29秒前
mmmin发布了新的文献求助10
29秒前
30秒前
漠之梦完成签到,获得积分10
33秒前
34秒前
advance完成签到,获得积分0
37秒前
Ava应助csx采纳,获得10
38秒前
39秒前
lizishu应助mmmin采纳,获得30
40秒前
无花果应助吕佩采纳,获得10
42秒前
清脆的善愁完成签到,获得积分10
42秒前
vivi完成签到 ,获得积分10
44秒前
光亮的正豪完成签到,获得积分10
45秒前
rodrisk完成签到 ,获得积分10
46秒前
fragile完成签到,获得积分10
47秒前
kelaier发布了新的文献求助10
48秒前
NexusExplorer应助jiajia采纳,获得10
50秒前
sunny完成签到,获得积分10
51秒前
阿蒙蒙完成签到 ,获得积分10
54秒前
高分求助中
液晶指向矢仿真分析数据集 8888
Invited Discussant 63O and 64O 1000
Dr. Dirk Wiechmann on Lingual Orthodontics: Part I 888
Ideology and Meaning-Making under the Putin Regime 750
化工技术经济第五版电子版 500
Petrology and Plate Tectonics 500
Writing Systems 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 计算机科学 化学工程 生物化学 物理 内科学 复合材料 催化作用 光电子学 物理化学 电极 细胞生物学 基因 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6879704
求助须知:如何正确求助?哪些是违规求助? 8579632
关于积分的说明 18229159
捐赠科研通 6262045
什么是DOI,文献DOI怎么找? 3054751
关于科研通互助平台的介绍 2064564
邀请新用户注册赠送积分活动 2032443