Orthogonal Gradient Penalty for Fast Training of Wasserstein GAN Based Multi-Task Autoencoder toward Robust Speech Recognition

自编码 计算机科学 任务(项目管理) 培训(气象学) 语音识别 人工智能 模式识别(心理学) 训练集 深度学习 物理 管理 气象学 经济
作者
Chao-Yuan KAO,Sangwook Park,Alzahra Badi,David K. Han,Hanseok Ko
出处
期刊:IEICE Transactions on Information and Systems [Institute of Electronics, Information and Communication Engineers]
卷期号:E103.D (5): 1195-1198 被引量:1
标识
DOI:10.1587/transinf.2019edl8183
摘要

Performance in Automatic Speech Recognition (ASR) degrades dramatically in noisy environments. To alleviate this problem, a variety of deep networks based on convolutional neural networks and recurrent neural networks were proposed by applying L1 or L2 loss. In this Letter, we propose a new orthogonal gradient penalty (OGP) method for Wasserstein Generative Adversarial Networks (WGAN) applied to denoising and despeeching models. WGAN integrates a multi-task autoencoder which estimates not only speech features but also noise features from noisy speech. While achieving 14.1% improvement in Wasserstein distance convergence rate, the proposed OGP enhanced features are tested in ASR and achieve 9.7%, 8.6%, 6.2%, and 4.8% WER improvements over DDAE, MTAE, R-CED(CNN) and RNN models.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
ttttt发布了新的文献求助10
刚刚
刚刚
1秒前
精明的晓曼完成签到,获得积分10
1秒前
1秒前
mnll完成签到,获得积分10
1秒前
3152发布了新的文献求助10
2秒前
123发布了新的文献求助10
2秒前
2秒前
石石石发布了新的文献求助10
2秒前
HESOYAM完成签到 ,获得积分10
2秒前
Orange应助jam采纳,获得10
2秒前
qq发布了新的文献求助10
2秒前
3秒前
3秒前
3秒前
3秒前
mxy126354发布了新的文献求助10
4秒前
ttt完成签到,获得积分10
4秒前
欢呼曼荷发布了新的文献求助10
4秒前
4秒前
4秒前
科研通AI6.2应助刘奎冉采纳,获得10
5秒前
haochi发布了新的文献求助30
5秒前
6秒前
陌上完成签到,获得积分10
6秒前
ttttt完成签到,获得积分10
6秒前
Qing完成签到,获得积分10
6秒前
安成发布了新的文献求助10
6秒前
太叔若南发布了新的文献求助30
7秒前
在水一方应助qq采纳,获得10
7秒前
7秒前
zxx发布了新的文献求助10
7秒前
7秒前
7秒前
学学学发布了新的文献求助10
8秒前
斯文败类应助liangc110采纳,获得10
8秒前
六六发布了新的文献求助10
8秒前
123完成签到,获得积分10
8秒前
石石石完成签到,获得积分10
8秒前
高分求助中
Overcoming Stigma and Bias in Obesity Management 800
Malcolm Fraser : a biography 700
Signals, Systems, and Signal Processing 610
Materials selection in mechanical design 500
Bounds for Statistical Estimation in Semiparametric Models 500
Forced degradation and stability indicating LC method for Letrozole: A stress testing guide 500
Ideology and Meaning-Making under the Putin Regime 450
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6479131
求助须知:如何正确求助?哪些是违规求助? 8280484
关于积分的说明 17661154
捐赠科研通 5561688
什么是DOI,文献DOI怎么找? 2911389
邀请新用户注册赠送积分活动 1888380
关于科研通互助平台的介绍 1742388