清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Multi-modal graph contrastive encoding for neural machine translation

计算机科学 情态动词 机器翻译 人工智能 图形 判决 自然语言处理 场景图 模式识别(心理学) 理论计算机科学 渲染(计算机图形) 化学 高分子化学
作者
Youtan Yin,Jiali Zeng,Jinsong Su,Chulun Zhou,Fandong Meng,Jie Zhou,Degen Huang,Jiebo Luo
出处
期刊:Artificial Intelligence [Elsevier]
卷期号:323: 103986-103986 被引量:1
标识
DOI:10.1016/j.artint.2023.103986
摘要

As an important extension of conventional text-only neural machine translation (NMT), multi-modal neural machine translation (MNMT) aims to translate input source sentences paired with images into the target language. Although a lot of MNMT models have been proposed to perform multi-modal semantic fusion, they do not consider fine-grained semantic correspondences between semantic units of different modalities (i.e., words and visual objects), which can be exploited to refine multi-modal representation learning via fine-grained semantic interactions. To address this issue, we propose a graph-based multi-modal fusion encoder for NMT. Concretely, we first employ a unified multi-modal graph to represent the input sentence and image, in which the multi-modal semantic units are considered as the nodes in the graph, connected by two kinds of edges with different semantic relationships. Then, we stack multiple graph-based multi-modal fusion layers that iteratively conduct intra- and inter-modal interactions to learn node representations. Finally, via an attention mechanism, we induce a multi-modal context from the top node representations for the decoder. Particularly, we introduce a progressive contrastive learning strategy based on the multi-modal graph to refine the training of our proposed model, where hard negative samples are introduced gradually. To evaluate our model, we conduct experiments on commonly-used datasets. Experimental results and analysis show that our MNMT model obtains significant improvements over competitive baselines, achieving state-of-the-art performance on the Multi30K dataset.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
哈哈完成签到 ,获得积分10
19秒前
打鬼忍者完成签到 ,获得积分10
27秒前
racill完成签到 ,获得积分10
59秒前
稻子完成签到 ,获得积分10
1分钟前
信封完成签到 ,获得积分10
1分钟前
1分钟前
Maolin完成签到 ,获得积分10
1分钟前
savannah发布了新的文献求助30
1分钟前
李健的小迷弟应助savannah采纳,获得10
2分钟前
X519664508完成签到,获得积分0
4分钟前
共享精神应助哈哈哈采纳,获得10
4分钟前
4分钟前
coco完成签到 ,获得积分10
4分钟前
kokodayour完成签到,获得积分10
5分钟前
XJ发布了新的文献求助10
5分钟前
5分钟前
xun发布了新的文献求助10
6分钟前
xun完成签到,获得积分20
6分钟前
南宫秃完成签到,获得积分0
6分钟前
胜胜糖完成签到 ,获得积分10
6分钟前
轻松的孤云完成签到 ,获得积分10
6分钟前
冰释之川完成签到 ,获得积分10
6分钟前
资白玉完成签到 ,获得积分10
7分钟前
JunoDrain完成签到,获得积分10
7分钟前
Mipe发布了新的文献求助10
7分钟前
一辉完成签到 ,获得积分0
8分钟前
8分钟前
刘天虎研通完成签到 ,获得积分10
8分钟前
小虫完成签到 ,获得积分10
8分钟前
Mipe完成签到,获得积分10
9分钟前
banwo完成签到,获得积分20
9分钟前
banwo发布了新的文献求助30
9分钟前
563完成签到,获得积分10
10分钟前
呆呆的猕猴桃完成签到 ,获得积分10
10分钟前
阜睿完成签到 ,获得积分10
10分钟前
wx1完成签到 ,获得积分0
11分钟前
12分钟前
漂移猪完成签到 ,获得积分10
12分钟前
Noah完成签到 ,获得积分10
12分钟前
肝胆外科医生完成签到 ,获得积分10
12分钟前
高分求助中
Un calendrier babylonien des travaux, des signes et des mois: Séries iqqur îpuš 1036
Quantum Science and Technology Volume 5 Number 4, October 2020 1000
Formgebungs- und Stabilisierungsparameter für das Konstruktionsverfahren der FiDU-Freien Innendruckumformung von Blech 1000
IG Farbenindustrie AG and Imperial Chemical Industries Limited strategies for growth and survival 1925-1953 800
Sustainable Land Management: Strategies to Cope with the Marginalisation of Agriculture 600
Prochinois Et Maoïsmes En France (et Dans Les Espaces Francophones) 500
Offline version of the Proceedings of 15th EWTEC 2023, Bilbao 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2524795
求助须知:如何正确求助?哪些是违规求助? 2166338
关于积分的说明 5556862
捐赠科研通 1886527
什么是DOI,文献DOI怎么找? 939408
版权声明 564588
科研通“疑难数据库(出版商)”最低求助积分说明 501072