Combine Early and Late Fusion Together: A Hybrid Fusion Framework for Image-Text Matching

计算机科学 匹配(统计) 人工智能 图像融合 情态动词 模式 模态(人机交互) 融合 图像(数学) 相似性(几何) 代表(政治) 方案(数学) 任务(项目管理) 模式识别(心理学) 传感器融合 自然语言处理 机器学习 计算机视觉 数学 工程类 数学分析 社会科学 语言学 统计 化学 哲学 系统工程 社会学 政治 政治学 高分子化学 法学
作者
Yifan Wang,Xing Xu,Wu Yu,Ruicong Xu,Zhiwei Cao,Heng Tao Shen
标识
DOI:10.1109/icme51207.2021.9428201
摘要

Image-text matching is a challenging task in cross-modal learning due to the discrepancy of data representation be-tween different modalities of images and texts. The main-stream methods adopt the late fusion to generate image-text similarity on encoded cross-modal features, and put effort to capture intra-modality associations with considerably high training cost. In this work, we propose to Combine Early and Late Fusion Together (CELFT), which is a universal hybrid fusion framework that can effectively overcome the above shortcomings of the late fusion scheme. In the pro-posed CELFT framework, the hybrid structure with early fusion and late fusion could facilitate the interaction between image and text modalities at early stage. Moreover, these two kinds of fusion strategies complement each other in capturing the inter-modal and intra-modal information, which ensure to learn more accurate image-text similarity. In the experiments, we choose four latest approaches based on the late fusion scheme as the base models, and integrate them with our CELFT framework. The results on two widely used image-text datasets MSCOCO and Flickr30K show that the matching performance of all base models is significantly improved with remarkably reduced training time.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
哟哟哟完成签到,获得积分10
2秒前
仙女的小可爱完成签到 ,获得积分10
4秒前
科研巨人发布了新的文献求助10
5秒前
四不像会麋鹿完成签到,获得积分10
6秒前
赘婿应助苏习习采纳,获得10
7秒前
celia完成签到 ,获得积分10
7秒前
8秒前
思源应助大美女采纳,获得10
8秒前
搜集达人应助景飞丹采纳,获得30
8秒前
我是老大应助vv采纳,获得10
9秒前
10秒前
大锅猫发布了新的文献求助10
11秒前
12秒前
12秒前
昭昭完成签到,获得积分10
14秒前
bkagyin应助无奈的向雁采纳,获得10
15秒前
苏习习给苏习习的求助进行了留言
17秒前
小杨发布了新的文献求助10
17秒前
minic发布了新的文献求助10
17秒前
17秒前
科研巨人完成签到,获得积分10
17秒前
18秒前
水晶泡泡应助Ko采纳,获得30
18秒前
19秒前
gjww应助dyfsj采纳,获得10
20秒前
20秒前
大美女发布了新的文献求助10
21秒前
田様应助小潘同学采纳,获得10
22秒前
JamesPei应助小王爱科研采纳,获得10
25秒前
sissisue发布了新的文献求助10
26秒前
26秒前
中中发布了新的文献求助20
28秒前
30秒前
30秒前
31秒前
溯风完成签到 ,获得积分10
32秒前
orixero应助开心的毛豆采纳,获得10
33秒前
筱雯发布了新的文献求助10
33秒前
35秒前
景飞丹发布了新的文献求助30
36秒前
高分求助中
Teaching Social and Emotional Learning in Physical Education 900
Plesiosaur extinction cycles; events that mark the beginning, middle and end of the Cretaceous 800
Recherches Ethnographiques sue les Yao dans la Chine du Sud 500
Two-sample Mendelian randomization analysis reveals causal relationships between blood lipids and venous thromboembolism 500
Chinese-English Translation Lexicon Version 3.0 500
Wisdom, Gods and Literature Studies in Assyriology in Honour of W. G. Lambert 400
薩提亞模式團體方案對青年情侶輔導效果之研究 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2392945
求助须知:如何正确求助?哪些是违规求助? 2097132
关于积分的说明 5284386
捐赠科研通 1824829
什么是DOI,文献DOI怎么找? 910039
版权声明 559943
科研通“疑难数据库(出版商)”最低求助积分说明 486295