Efficient Context-Aware Neural Machine Translation with Layer-Wise Weighting and Input-Aware Gating

计算机科学 判决 机器翻译 编码器 人工智能 变压器 解码方法 自然语言处理 背景(考古学) 编码(内存) 上下文模型 编码 源代码 语音识别 算法 古生物学 生物化学 化学 物理 量子力学 电压 对象(语法) 基因 生物 操作系统
作者
Hongfei Xu,Deyi Xiong,Josef van Genabith,Qiuhui Liu
标识
DOI:10.24963/ijcai.2020/544
摘要

Existing Neural Machine Translation (NMT) systems are generally trained on a large amount of sentence-level parallel data, and during prediction sentences are independently translated, ignoring cross-sentence contextual information. This leads to inconsistency between translated sentences. In order to address this issue, context-aware models have been proposed. However, document-level parallel data constitutes only a small part of the parallel data available, and many approaches build context-aware models based on a pre-trained frozen sentence-level translation model in a two-step training manner. The computational cost of these approaches is usually high. In this paper, we propose to make the most of layers pre-trained on sentence-level data in contextual representation learning, reusing representations from the sentence-level Transformer and significantly reducing the cost of incorporating contexts in translation. We find that representations from shallow layers of a pre-trained sentence-level encoder play a vital role in source context encoding, and propose to perform source context encoding upon weighted combinations of pre-trained encoder layers' outputs. Instead of separately performing source context and input encoding, we propose to iteratively and jointly encode the source input and its contexts and to generate input-aware context representations with a cross-attention layer and a gating mechanism, which resets irrelevant information in context encoding. Our context-aware Transformer model outperforms the recent CADec [Voita et al., 2019c] on the English-Russian subtitle data and is about twice as fast in training and decoding.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
柯基海豹完成签到,获得积分10
刚刚
CipherSage应助金小白采纳,获得10
刚刚
zyl发布了新的文献求助10
1秒前
谨慎雅山完成签到,获得积分10
2秒前
沉思猫发布了新的文献求助10
2秒前
ZYX完成签到,获得积分10
2秒前
灿烂完成签到 ,获得积分10
2秒前
www完成签到,获得积分10
2秒前
Lucas应助刘恩瑜采纳,获得10
3秒前
顾矜应助哈哈哈采纳,获得10
3秒前
JamesPei应助牛顿的苹果采纳,获得10
4秒前
Joel发布了新的文献求助10
4秒前
5秒前
5秒前
大白白发布了新的文献求助10
6秒前
6秒前
xiaomei关注了科研通微信公众号
6秒前
6秒前
7秒前
7秒前
Avalonx举报健康的紫易求助涉嫌违规
8秒前
wanci应助Jane_2022采纳,获得10
8秒前
lskjdpod完成签到,获得积分10
9秒前
孙毅航发布了新的文献求助10
10秒前
10秒前
fxx发布了新的文献求助10
10秒前
犹豫语琴发布了新的文献求助10
13秒前
沉思猫完成签到,获得积分10
14秒前
15秒前
15秒前
谦让听筠发布了新的文献求助10
16秒前
16秒前
16秒前
xiGuaD给xiGuaD的求助进行了留言
16秒前
16秒前
孤独的谷秋完成签到,获得积分10
17秒前
18秒前
xz完成签到,获得积分10
18秒前
18秒前
杨乐发布了新的文献求助10
19秒前
高分求助中
Cronologia da história de Macau 5000
Erwählung und Berufung bei Paulus: Bedeutung, Entwicklung und Funktion einer Vorstellung in ihrem frühjüdischen und griechisch-römischen Kontext 850
Matrix Methods in Data Mining and Pattern Recognition 510
Interactions of Vowel Quality and Prosody in East Slavic 500
用于植入式医疗器械的馈通设计与实现 400
Animalia: Animal and Human Interaction in the Early Medieval English World (Exeter Studies in Medieval Europe) 400
Synfacts Issue 07 · Volume 22 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 内科学 物理 复合材料 催化作用 细胞生物学 无机化学 光电子学 物理化学 电极 基因
热门帖子
关注 科研通微信公众号,转发送积分 7135441
求助须知:如何正确求助?哪些是违规求助? 8784549
关于积分的说明 18571188
捐赠科研通 6720860
什么是DOI,文献DOI怎么找? 3153671
关于科研通互助平台的介绍 2279416
邀请新用户注册赠送积分活动 2128105