亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Multi-Granularity Interactive Transformer Hashing for Cross-modal Retrieval

计算机科学 粒度 散列函数 情态动词 人工智能 变压器 特征学习 模态(人机交互) 模式 自然语言处理 化学 高分子化学 社会科学 物理 计算机安全 量子力学 电压 社会学 操作系统
作者
Yishu Liu,WU Qing-peng,Zheng Zhang,Jingyi Zhang,Guangming Lu
标识
DOI:10.1145/3581783.3612411
摘要

With the powerful representation ability and privileged efficiency, deep cross-modal hashing (DCMH) has become an emerging fast similarity search technique. Prior studies primarily focus on exploring pairwise similarities across modalities, but fail to comprehensively capture the multi-grained semantic correlations during intra- and inter-modal negotiation. To tackle this issue, this paper proposes a novel Multi-granularity Interactive Transformer Hashing (MITH) network, which hierarchically considers both coarse- and fine-grained similarity measurements across different modalities in one unified transformer-based framework. To the best of our knowledge, this is the first attempt for multi-granularity transformer-based cross-modal hashing. Specifically, a well-designed distilled intra-modal interaction module is deployed to excavate modality-specific concept knowledge with global-local knowledge distillation under the guidance of implicit conceptual category-level representations. Moreover, we construct a contrastive inter-modal alignment module to mine modality-independent semantic concept correspondences with instance- and token-wise contrastive learning, respectively. Such a collaborative learning paradigm can jointly alleviate the heterogeneity and semantic gaps among different modalities from a multi-granularity perspective, yielding discriminative modality-invariant hash codes. Extensive experiments on multiple representative cross-modal datasets demonstrate the consistent superiority of MITH over the existing state-of-the-art baselines. The codes are available at https://github.com/DarrenZZhang/MITH.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
4秒前
胖哥发布了新的文献求助10
9秒前
落后安青完成签到,获得积分10
10秒前
兼听则明完成签到,获得积分10
20秒前
26秒前
Kaikai发布了新的文献求助10
45秒前
Martina完成签到,获得积分10
47秒前
1分钟前
1分钟前
Copyright应助科研通管家采纳,获得10
1分钟前
朴素的语兰完成签到,获得积分10
1分钟前
英勇的落雁完成签到,获得积分10
2分钟前
生动盼兰完成签到,获得积分10
2分钟前
3分钟前
Martina发布了新的文献求助10
3分钟前
朴实的新柔完成签到,获得积分10
3分钟前
怕黑的小甜瓜完成签到,获得积分10
4分钟前
陶醉之柔完成签到,获得积分10
4分钟前
4分钟前
Martina发布了新的文献求助10
4分钟前
4分钟前
殷勤的紫槐应助lsl采纳,获得500
4分钟前
5分钟前
三毛完成签到 ,获得积分10
5分钟前
Copyright应助科研通管家采纳,获得10
5分钟前
5分钟前
6分钟前
bkagyin应助大气大侠采纳,获得10
6分钟前
Kao应助颜羽忆采纳,获得10
6分钟前
花花发布了新的文献求助10
6分钟前
邢一完成签到 ,获得积分10
6分钟前
6分钟前
花花完成签到,获得积分20
6分钟前
忧郁凌波完成签到,获得积分10
6分钟前
大气大侠发布了新的文献求助10
6分钟前
orixero应助碎碎采纳,获得10
6分钟前
6分钟前
MchemG完成签到,获得积分0
6分钟前
6分钟前
科研通AI6.2应助碎碎采纳,获得10
7分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Prompt Engineering for Clinicians: Harnessing AI in Everyday Medical Practice 600
REAL-WORLD EFFICACY AND GENOMIC LANDSCAPE OF POLATUZUMA VEDOTIN-BASED FIRST-LINE THERAPY IN DIFFUSE LARGE B-CELL LYMPHOMA: A FOCUS ON TP53 MUTATIONS AND TREATMENT RESPONSE 500
Handbook of Luminescence Dating 500
Safety Pharmacology 500
《KNN基无铅压电陶瓷电学性能优化与物理机理研究》 500
Philosophy of Mind A Contemporary Introduction 5th Edition 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 计算机科学 化学工程 生物化学 物理 内科学 复合材料 催化作用 光电子学 物理化学 电极 细胞生物学 基因 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6968724
求助须知:如何正确求助?哪些是违规求助? 8649762
关于积分的说明 18340517
捐赠科研通 6423285
什么是DOI,文献DOI怎么找? 3088694
关于科研通互助平台的介绍 2140768
邀请新用户注册赠送积分活动 2065135