U-GAT-VC: Unsupervised Generative Attentional Networks for Non-Parallel Voice Conversion

计算机科学 自然性 光谱图 语音识别 水准点(测量) 趋同(经济学) 人工智能 光学(聚焦) 人工神经网络 生成模型 生成语法 模式识别(心理学) 物理 大地测量学 量子力学 经济增长 光学 经济 地理
作者
Shi Sheng,Jiahao Shao,Hong Hao,Yangzhou Du,Jianping Fan
标识
DOI:10.1109/icassp43922.2022.9746992
摘要

Non-parallel voice conversion (VC) is a technique of transfer-ring voice from one style to another without using a parallel corpus in model training. Various methods are proposed to approach non-parallel VC using deep neural networks. Among them, CycleGAN-VC and its variants have been widely accepted as benchmark methods. However, there is still a gap to bridge between the real target and converted voice and an increased number of parameters leads to slow convergence in training process. Inspired by recent advancements in unsupervised image translation, we propose a new end-to-end unsupervised framework U-GAT-VC that adopts a novel inter- and intra-attention mechanism to guide the voice conversion to focus on more important regions in spectrograms. We also introduce disentangle perceptual loss in our model to capture high-level spectral features. Subjective and objective evaluations shows our proposed model outperforms CycleGAN-VC2/3 in terms of conversion quality and voice naturalness.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
2秒前
3秒前
YKLLL完成签到,获得积分10
3秒前
奥一奥发布了新的文献求助50
7秒前
7秒前
bbq发布了新的文献求助10
7秒前
脑洞疼应助缥缈的藏鸟采纳,获得10
9秒前
123发布了新的文献求助30
9秒前
Lucas应助难难难采纳,获得10
9秒前
YKLLL发布了新的文献求助20
11秒前
13秒前
13秒前
14秒前
16秒前
cctv18应助restudy68采纳,获得10
16秒前
星辰大海应助奥一奥采纳,获得10
17秒前
ricetao发布了新的文献求助10
18秒前
20秒前
20秒前
天天快乐应助gy采纳,获得10
20秒前
Jammm发布了新的文献求助10
20秒前
21秒前
共享精神应助乐正怡采纳,获得10
22秒前
小布丁发布了新的文献求助10
22秒前
doctor完成签到,获得积分10
23秒前
丞丞丞发布了新的文献求助10
24秒前
27秒前
ricetao完成签到,获得积分10
27秒前
cc发布了新的文献求助10
27秒前
27秒前
银剑邪巫完成签到,获得积分10
27秒前
Coco发布了新的文献求助10
28秒前
cxlhzq发布了新的文献求助30
30秒前
31秒前
31秒前
丘比特应助快乐小菜瓜采纳,获得10
32秒前
qiuqiu完成签到,获得积分10
32秒前
银剑邪巫发布了新的文献求助10
33秒前
我是老大应助小布丁采纳,获得10
33秒前
高分求助中
Teaching Social and Emotional Learning in Physical Education 900
Plesiosaur extinction cycles; events that mark the beginning, middle and end of the Cretaceous 500
Chinese-English Translation Lexicon Version 3.0 500
[Lambert-Eaton syndrome without calcium channel autoantibodies] 440
Two-sample Mendelian randomization analysis reveals causal relationships between blood lipids and venous thromboembolism 400
薩提亞模式團體方案對青年情侶輔導效果之研究 400
3X3 Basketball: Everything You Need to Know 310
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2387107
求助须知:如何正确求助?哪些是违规求助? 2093515
关于积分的说明 5268543
捐赠科研通 1820249
什么是DOI,文献DOI怎么找? 908042
版权声明 559248
科研通“疑难数据库(出版商)”最低求助积分说明 485068