Generative label fused network for image–text matching

计算机科学 人工智能 生成语法 桥接(联网) 语义鸿沟 自然语言处理 匹配(统计) 保险丝(电气) 图像(数学) 光学(聚焦) 词(群论) 模式识别(心理学) 情报检索 图像检索 语言学 统计 数学 计算机网络 物理 哲学 光学 电气工程 工程类
作者
Guoshuai Zhao,Chaofeng Zhang,Heng Shang,Yaxiong Wang,Li Zhu,Xueming Qian
出处
期刊:Knowledge Based Systems [Elsevier]
卷期号:263: 110280-110280 被引量:14
标识
DOI:10.1016/j.knosys.2023.110280
摘要

Although there is a long line of research on bidirectional image–text matching, the problem remains a challenge due to the well-known semantic gap between visual and textual modalities. Popular solutions usually first detect the objects and then find the association between visual objects and the textual words to estimate the relevance; however, these methods only focus on the visual object features while ignoring the semantic attributions of the detected regions, which is an important clue in terms of bridging the semantic gap. To remedy this issue, we propose a generative multiattribution tag fusion method that further includes region attribution to alleviate the semantic gap. In particular, our method comprises three steps: the extraction of image features, the extraction of text features, and the matching of image and text by an attention mechanism. We first divide the image into blocks to obtain the region image features and region attribute labels. Then, we fuse them to reduce the semantic gap between the image features and text features. Second, BERT and bi-GRU are used to extract text features, and third, we use the attention mechanism to match each area in the image with each word in the text with the same meaning. The quantitative and qualitative results on the public datasets Flickr30K and MS-COCO demonstrate the effectiveness of our method. The source code is released on Github https://github.com/smileslabsh/Generative-Label-Fused-Network.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
pluto应助鸽子采纳,获得10
4秒前
7秒前
9秒前
阔达的惠完成签到,获得积分10
10秒前
ziyue发布了新的文献求助10
12秒前
星辰大海应助刘岩采纳,获得10
13秒前
酷波er应助陈美馨采纳,获得10
13秒前
阔达的惠发布了新的文献求助10
13秒前
pinging完成签到,获得积分10
16秒前
17秒前
gmjinfeng完成签到,获得积分10
18秒前
Singularity应助阔达的惠采纳,获得10
20秒前
完美世界应助ziyue采纳,获得10
21秒前
雪哲伊发布了新的文献求助10
23秒前
zhBian完成签到 ,获得积分10
27秒前
吉利宝发布了新的文献求助10
30秒前
ericliuyj完成签到,获得积分10
32秒前
34秒前
leave完成签到,获得积分10
37秒前
yang发布了新的文献求助10
39秒前
Sir.夏季风完成签到,获得积分10
42秒前
47秒前
CodeCraft应助当哥采纳,获得10
50秒前
Alicia发布了新的文献求助30
52秒前
53秒前
隐形曼青应助科研通管家采纳,获得10
53秒前
科研通AI2S应助科研通管家采纳,获得10
53秒前
汉堡包应助科研通管家采纳,获得10
53秒前
53秒前
科研通AI2S应助科研通管家采纳,获得10
53秒前
星辰大海应助科研通管家采纳,获得10
53秒前
Alicia完成签到,获得积分10
57秒前
黄焖鸡完成签到 ,获得积分10
59秒前
1分钟前
无欲无求完成签到,获得积分10
1分钟前
刘岩发布了新的文献求助10
1分钟前
打打应助lkb采纳,获得10
1分钟前
1分钟前
1234发布了新的文献求助10
1分钟前
1分钟前
高分求助中
Thermodynamic data for steelmaking 3000
Manual of Clinical Microbiology, 4 Volume Set (ASM Books) 13th Edition 1000
Counseling With Immigrants, Refugees, and Their Families From Social Justice Perspectives pages 800
マンネンタケ科植物由来メロテルペノイド類の網羅的全合成/Collective Synthesis of Meroterpenoids Derived from Ganoderma Family 500
Electrochemistry 500
Broflanilide prolongs the development of fall armyworm Spodoptera frugiperda by regulating biosynthesis of juvenile hormone 400
Statistical Procedures for the Medical Device Industry 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2370424
求助须知:如何正确求助?哪些是违规求助? 2079130
关于积分的说明 5205664
捐赠科研通 1806332
什么是DOI,文献DOI怎么找? 901636
版权声明 558148
科研通“疑难数据库(出版商)”最低求助积分说明 481361