Giving Text More Imagination Space for Image-text Matching

计算机科学 人工智能 概括性 匹配(统计) 光学(聚焦) 情态动词 图像(数学) 自然语言处理 空格(标点符号) 特征(语言学) 模式识别(心理学) 语言学 数学 心理学 哲学 物理 化学 高分子化学 光学 操作系统 心理治疗师 统计
作者
Xinfeng Dong,Longfei Han,Dingwen Zhang,Li Liu,Junwei Han,Huaxiang Zhang
标识
DOI:10.1145/3581783.3612103
摘要

Image-text matching is a hot topic in multi-modal analysis. The existing image-text matching algorithms focus on bridging the heterogeneity gap and mapping the feature into a common space under strong alignment assumption. However, these methods have unsatisfactory performance under the weak alignment scenario, which assumes that the text contains more abstract information, and the number of entities in the text is always fewer than objects in image. This is the first time, from our knowledge, to solve the image-text matching problem from the perspective of information difference with weak alignment. In order to both narrow the cross-modal heterogeneity gap and balance the information discrepancy, we proposed an imagination network to enrich the text modality based on pre-trained framework, which is helpful for image-text matching. The imagination network utilizes reinforcement learning to enhance the semantic information for text modality, and an action refinement strategy is designed to constrain the freedom and divergence of imagination. The experiment results show the superiority and generality of the proposed framework based on two pre-trained models, CLIP and BLIP on two most frequently-used datasets MSCOCO and Flickr30K.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Dicy发布了新的文献求助10
刚刚
染东发布了新的文献求助10
刚刚
1秒前
3秒前
3秒前
CipherSage应助醉酒笑红尘采纳,获得10
3秒前
秋qiu发布了新的文献求助10
4秒前
思源应助活力半凡采纳,获得10
5秒前
积极鸵鸟发布了新的文献求助10
7秒前
8秒前
廉非笑发布了新的文献求助10
8秒前
所所应助科研通管家采纳,获得10
8秒前
科研通AI5应助科研通管家采纳,获得10
8秒前
8秒前
YifanWang应助科研通管家采纳,获得20
8秒前
SciGPT应助科研通管家采纳,获得10
8秒前
大个应助科研通管家采纳,获得10
8秒前
大个应助科研通管家采纳,获得10
9秒前
SciGPT应助科研通管家采纳,获得10
9秒前
烟花应助QiaoHL采纳,获得10
11秒前
牛牛关注了科研通微信公众号
12秒前
钟钟发布了新的文献求助10
13秒前
15秒前
Loik完成签到,获得积分10
15秒前
liudy完成签到,获得积分10
17秒前
Loik发布了新的文献求助10
17秒前
18秒前
20秒前
20秒前
liudy发布了新的文献求助10
21秒前
李斌关注了科研通微信公众号
21秒前
漱石发布了新的文献求助10
21秒前
bkagyin应助orchid采纳,获得10
24秒前
明理的青完成签到,获得积分10
24秒前
hyg发布了新的文献求助10
25秒前
董研发布了新的文献求助20
25秒前
27秒前
27秒前
27秒前
29秒前
高分求助中
Les Mantodea de Guyane Insecta, Polyneoptera 2500
Mobilization, center-periphery structures and nation-building 600
Technologies supporting mass customization of apparel: A pilot project 450
China—Art—Modernity: A Critical Introduction to Chinese Visual Expression from the Beginning of the Twentieth Century to the Present Day 430
Tip60 complex regulates eggshell formation and oviposition in the white-backed planthopper, providing effective targets for pest control 400
A Field Guide to the Amphibians and Reptiles of Madagascar - Frank Glaw and Miguel Vences - 3rd Edition 400
China Gadabouts: New Frontiers of Humanitarian Nursing, 1941–51 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3792160
求助须知:如何正确求助?哪些是违规求助? 3336436
关于积分的说明 10280990
捐赠科研通 3053122
什么是DOI,文献DOI怎么找? 1675474
邀请新用户注册赠送积分活动 803469
科研通“疑难数据库(出版商)”最低求助积分说明 761414