Multi-Granularity Interactive Transformer Hashing for Cross-modal Retrieval

计算机科学 粒度 散列函数 情态动词 人工智能 变压器 特征学习 模态(人机交互) 模式 自然语言处理 化学 高分子化学 社会科学 物理 计算机安全 量子力学 电压 社会学 操作系统
作者
Yishu Liu,WU Qing-peng,Zheng Zhang,Jingyi Zhang,Guangming Lu
标识
DOI:10.1145/3581783.3612411
摘要

With the powerful representation ability and privileged efficiency, deep cross-modal hashing (DCMH) has become an emerging fast similarity search technique. Prior studies primarily focus on exploring pairwise similarities across modalities, but fail to comprehensively capture the multi-grained semantic correlations during intra- and inter-modal negotiation. To tackle this issue, this paper proposes a novel Multi-granularity Interactive Transformer Hashing (MITH) network, which hierarchically considers both coarse- and fine-grained similarity measurements across different modalities in one unified transformer-based framework. To the best of our knowledge, this is the first attempt for multi-granularity transformer-based cross-modal hashing. Specifically, a well-designed distilled intra-modal interaction module is deployed to excavate modality-specific concept knowledge with global-local knowledge distillation under the guidance of implicit conceptual category-level representations. Moreover, we construct a contrastive inter-modal alignment module to mine modality-independent semantic concept correspondences with instance- and token-wise contrastive learning, respectively. Such a collaborative learning paradigm can jointly alleviate the heterogeneity and semantic gaps among different modalities from a multi-granularity perspective, yielding discriminative modality-invariant hash codes. Extensive experiments on multiple representative cross-modal datasets demonstrate the consistent superiority of MITH over the existing state-of-the-art baselines. The codes are available at https://github.com/DarrenZZhang/MITH.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
慕青应助文静的海采纳,获得20
1秒前
1秒前
WGY完成签到 ,获得积分20
2秒前
传奇3应助橘子果酱采纳,获得10
4秒前
Narcis发布了新的文献求助10
6秒前
7秒前
李健应助卓涵柏采纳,获得30
8秒前
cuican完成签到 ,获得积分10
9秒前
清秀尔岚关注了科研通微信公众号
10秒前
10秒前
美丽的芙完成签到 ,获得积分10
10秒前
trj完成签到,获得积分10
12秒前
13秒前
OOO发布了新的文献求助10
14秒前
uver完成签到,获得积分10
16秒前
csx发布了新的文献求助10
19秒前
Chemistry完成签到 ,获得积分10
19秒前
领导范儿应助CNNC采纳,获得10
19秒前
橘子果酱发布了新的文献求助10
20秒前
20秒前
xjtuwang0618完成签到,获得积分10
21秒前
21秒前
nnn完成签到,获得积分10
22秒前
22秒前
23秒前
Iokan发布了新的文献求助10
25秒前
27秒前
27秒前
清秀尔岚发布了新的文献求助10
29秒前
de铭发布了新的文献求助10
29秒前
29秒前
田雨弘完成签到 ,获得积分10
29秒前
32秒前
Jason发布了新的文献求助10
34秒前
cshuang发布了新的文献求助20
35秒前
37秒前
害怕的胡萝卜完成签到 ,获得积分10
37秒前
csx发布了新的文献求助10
38秒前
金妍昕发布了新的文献求助10
38秒前
高分求助中
液晶指向矢仿真分析数据集 8888
Invited Discussant 63O and 64O 1000
Dr. Dirk Wiechmann on Lingual Orthodontics: Part I 888
Ideology and Meaning-Making under the Putin Regime 750
化工技术经济第五版电子版 500
Petrology and Plate Tectonics 500
Writing Systems 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 计算机科学 化学工程 生物化学 物理 内科学 复合材料 催化作用 光电子学 物理化学 电极 细胞生物学 基因 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6879495
求助须知:如何正确求助?哪些是违规求助? 8579510
关于积分的说明 18229084
捐赠科研通 6261758
什么是DOI,文献DOI怎么找? 3054658
关于科研通互助平台的介绍 2064392
邀请新用户注册赠送积分活动 2032334