Unsupervised Cross-Corpus Speech Emotion Recognition Using a Multi-Source Cycle-GAN

情绪识别 语音识别 计算机科学 集合(抽象数据类型) 自然语言处理 价(化学) 注释 人工智能 量子力学 物理 程序设计语言
作者
Bo-Hao Su,Chi-Chun Lee
出处
期刊:IEEE Transactions on Affective Computing [Institute of Electrical and Electronics Engineers]
卷期号:14 (3): 1991-2004 被引量:14
标识
DOI:10.1109/taffc.2022.3146325
摘要

Speech emotion recognition (SER) plays a crucial role in understanding user feelings when developing artificial intelligence services. However, the data mismatch and label distortion between the training (source) set and the testing (target) set significantly degrade the performances when developing the SER systems. Additionally, most emotion-related speech datasets are highly contextualized and limited in size. The manual annotation cost is often too high leading to an active investigation of unsupervised cross-corpus SER techniques. In this paper, we propose a framework in unsupervised cross-corpus emotion recognition using multi-source corpus in a data augmentation manner. We introduced Corpus-Aware Emotional CycleGAN (CAEmoCyGAN) including a corpus-aware attention mechanism to aggregate each source datasets to generate the synthetic target sample. We choose the widely used speech emotion corpora the IEMOCAP and the VAM as sources and the MSP-Podcast as the target. By generating synthetic target-aware samples to augment source datasets and by directly training on this augmented dataset, our proposed multi-source target-aware augmentation method outperforms other baseline models in activation and valence classification.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
爆米花应助chncng12采纳,获得10
刚刚
潘杰完成签到,获得积分10
1秒前
晴天xy完成签到,获得积分10
1秒前
1秒前
FEMTO发布了新的文献求助10
1秒前
1秒前
2秒前
自横发布了新的文献求助10
2秒前
顾矜应助乐观鸣凤采纳,获得10
2秒前
xy完成签到 ,获得积分10
2秒前
卢大师发布了新的文献求助10
2秒前
3秒前
an完成签到,获得积分20
3秒前
杨杨杨完成签到,获得积分10
4秒前
百无禁忌完成签到,获得积分10
4秒前
瓜田白猹发布了新的文献求助10
4秒前
5秒前
目眩完成签到,获得积分10
5秒前
lolitam发布了新的文献求助10
5秒前
5秒前
顾矜应助哭唧唧采纳,获得10
5秒前
5秒前
lyz发布了新的文献求助10
6秒前
haokeyan发布了新的文献求助10
6秒前
忍冬发布了新的文献求助10
6秒前
6秒前
未来科研大牛关注了科研通微信公众号
6秒前
蓝兰发布了新的文献求助20
6秒前
小蘑菇应助lei采纳,获得10
6秒前
jackie发布了新的文献求助10
6秒前
7秒前
7秒前
QQLL完成签到,获得积分10
7秒前
7秒前
悄悄发布了新的文献求助10
8秒前
Tang完成签到,获得积分10
8秒前
8秒前
9秒前
吴睿璇发布了新的文献求助10
9秒前
kkkkkk8发布了新的文献求助10
9秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
The formation of Australian attitudes towards China, 1918-1941 640
Signals, Systems, and Signal Processing 610
全相对论原子结构与含时波包动力学的理论研究--清华大学 500
Elevating Next Generation Genomic Science and Technology using Machine Learning in the Healthcare Industry Applied Machine Learning for IoT and Data Analytics 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6443096
求助须知:如何正确求助?哪些是违规求助? 8257012
关于积分的说明 17584811
捐赠科研通 5501648
什么是DOI,文献DOI怎么找? 2900795
邀请新用户注册赠送积分活动 1877795
关于科研通互助平台的介绍 1717445