Composed Image Retrieval via Cross Relation Network With Hierarchical Aggregation Transformer

计算机科学 变压器 图像检索 数据挖掘 关系(数据库) 模式识别(心理学) 情报检索 人工智能 图像(数学) 电压 量子力学 物理
作者
Qian Yang,Mang Ye,Zhaohui Cai,Kehua Su,Bo Du
出处
期刊:IEEE transactions on image processing [Institute of Electrical and Electronics Engineers]
卷期号:32: 4543-4554 被引量:2
标识
DOI:10.1109/tip.2023.3299791
摘要

Composing Text and Image to Image Retrieval (CTI-IR) aims at finding the target image, which matches the query image visually along with the query text semantically. However, existing works ignore the fact that the reference text usually serves multiple functions, e.g., modification and auxiliary. To address this issue, we put forth a unified solution, namely Hierarchical Aggregation Transformer incorporated with Cross Relation Network (CRN). CRN unifies modification and relevance manner in a single framework. This configuration shows broader applicability, enabling us to model both modification and auxiliary text or their combination in triplet relationships simultaneously. Specifically, CRN includes: 1) Cross Relation Network comprehensively captures the relationships of various composed retrieval scenarios caused by two different query text types, allowing a unified retrieval model to designate adaptive combination strategies for flexible applicability; 2) Hierarchical Aggregation Transformer aggregates top-down features with Multi-layer Perceptron (MLP) to overcome the limitations of edge information loss in a window-based multi-stage Transformer. Extensive experiments demonstrate the superiority of the proposed CRN over all three fashion-domain datasets. Code is available at github.com/yan9qu/crn.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
4秒前
4秒前
5秒前
6秒前
pu完成签到 ,获得积分10
6秒前
碧玺发布了新的文献求助10
9秒前
weiwei发布了新的文献求助20
10秒前
10秒前
特来骑发布了新的文献求助10
10秒前
11秒前
wy123完成签到 ,获得积分10
12秒前
12秒前
隐形曼青应助easy采纳,获得10
12秒前
666发布了新的文献求助10
13秒前
13秒前
木悠发布了新的文献求助20
13秒前
随便发布了新的文献求助30
14秒前
爆米花应助徐志维采纳,获得10
14秒前
14秒前
18秒前
沉静龙猫发布了新的文献求助10
19秒前
dktrrrr发布了新的文献求助10
20秒前
zy_asd关注了科研通微信公众号
21秒前
聪明梦容完成签到,获得积分20
22秒前
奶糖爱果冻完成签到 ,获得积分10
22秒前
111111发布了新的文献求助10
23秒前
24秒前
开心绿柳发布了新的文献求助10
26秒前
共享精神应助代码采纳,获得10
26秒前
27秒前
菲1208完成签到,获得积分10
28秒前
榴莲发布了新的文献求助10
29秒前
easy发布了新的文献求助10
30秒前
koukousang完成签到,获得积分10
30秒前
li发布了新的文献求助10
30秒前
科目三应助111111采纳,获得10
32秒前
34秒前
orixero应助聪明梦容采纳,获得10
34秒前
天气晴朗完成签到,获得积分20
35秒前
dktrrrr发布了新的文献求助30
37秒前
高分求助中
Formgebungs- und Stabilisierungsparameter für das Konstruktionsverfahren der FiDU-Freien Innendruckumformung von Blech 1000
The Illustrated History of Gymnastics 800
The Bourse of Babylon : market quotations in the astronomical diaries of Babylonia 680
[Echocardiography and tissue Doppler imaging in assessment of haemodynamics in patients with idiopathic, premature ventricular complexes] 600
The role of a multidrug-resistance gene (lemdrl) in conferring vinblastine resistance in Leishmania enriettii 310
Aspects of Babylonian Celestial Divination : The Lunar Eclipse Tablets of Enuma Anu Enlil 300
Methods in Cell Biology 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2512007
求助须知:如何正确求助?哪些是违规求助? 2160686
关于积分的说明 5533673
捐赠科研通 1881120
什么是DOI,文献DOI怎么找? 936019
版权声明 564272
科研通“疑难数据库(出版商)”最低求助积分说明 499815