Speech emotion recognition based on convolutional neural network with attention-based bidirectional long short-term memory network and multi-task learning

计算机科学 光谱图 卷积神经网络 任务(项目管理) 一般化 人工智能 人工神经网络 语音识别 深度学习 特征(语言学) 滤波器(信号处理) 频道(广播) 模式识别(心理学) 计算机视觉 工程类 数学 语言学 数学分析 哲学 系统工程 计算机网络
作者
Zhentao Liu,Mengting Han,Bao-Han Wu,Abdul Rehman
出处
期刊:Applied Acoustics [Elsevier]
卷期号:202: 109178-109178 被引量:64
标识
DOI:10.1016/j.apacoust.2022.109178
摘要

Speech emotion recognition (SER) is a challenging task since the distribution of the features is different among various people. To improve generalization performance and accuracy of SER, we employ balanced augmented sampling on the triple-channel log-Mel spectrograms to improve the imbalance of the sample distribution among emotional categories and provide sufficient inputs for the deep neural network model. Time-domain filter and frequency-domain filter are used to process the triple-channel log-Mel spectrograms respectively in order to increase the diversity of features. After that, a deep neural network composed of convolutional neural network (CNN) and attention-based bidirectional long short-term memory network (ABLSTM) is employed for feature extraction, in which multi-task learning is adopted to improve the performance of the deep neural network. We select seven auxiliary tasks and determine the optimal auxiliary tasks through experimental comparison. Finally, our method is evaluated on IEMOCAP and MSP-IMPROV database, and it achieves 70.27% and 66.27% in terms of WAR and UAR on IEMOCAP database, while the WAR and UAR are 60.90% and 61.83% on MSP-IMPROV database respectively, which demonstrates its better performance than other works.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
2秒前
3秒前
4秒前
情怀应助Taylor采纳,获得10
5秒前
浮游应助三井库里采纳,获得10
6秒前
7秒前
Akim应助xuan采纳,获得10
8秒前
科研通AI6应助Heisnn采纳,获得10
10秒前
胡涂图发布了新的文献求助10
10秒前
曾高高发布了新的文献求助10
10秒前
11秒前
阳光新筠完成签到,获得积分10
11秒前
成就溪灵完成签到 ,获得积分10
11秒前
虚幻平露完成签到,获得积分10
12秒前
赘婿应助Yaochi_Suan采纳,获得10
13秒前
善学以致用应助Yaochi_Suan采纳,获得10
13秒前
科研通AI6应助Yaochi_Suan采纳,获得10
13秒前
香蕉觅云应助Yaochi_Suan采纳,获得10
13秒前
仲颖完成签到,获得积分10
13秒前
14秒前
14秒前
czz发布了新的文献求助10
14秒前
16秒前
16秒前
Taylor发布了新的文献求助10
16秒前
河豚素应助快乐听南采纳,获得10
17秒前
猴子应助热情的远锋采纳,获得10
18秒前
爆米花应助平安喜乐采纳,获得10
18秒前
13发布了新的文献求助10
18秒前
爆米花应助毕业在即采纳,获得10
18秒前
19秒前
ZKL完成签到,获得积分10
19秒前
徐凌凤发布了新的文献求助10
20秒前
xuan发布了新的文献求助10
20秒前
邓佳鑫Alan应助444采纳,获得10
20秒前
吴吴完成签到 ,获得积分10
20秒前
赘婿应助Taylor采纳,获得10
21秒前
迨你个迨迨完成签到,获得积分20
21秒前
星辰大海应助小乔采纳,获得10
21秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Complete Pro-Guide to the All-New Affinity Studio: The A-to-Z Master Manual: Master Vector, Pixel, & Layout Design: Advanced Techniques for Photo, Designer, and Publisher in the Unified Suite 1000
Synthesis and properties of compounds of the type A (III) B2 (VI) X4 (VI), A (III) B4 (V) X7 (VI), and A3 (III) B4 (V) X9 (VI) 500
Microbially Influenced Corrosion of Materials 500
Die Fliegen der Palaearktischen Region. Familie 64 g: Larvaevorinae (Tachininae). 1975 500
The YWCA in China The Making of a Chinese Christian Women’s Institution, 1899–1957 400
Numerical controlled progressive forming as dieless forming 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5400986
求助须知:如何正确求助?哪些是违规求助? 4520031
关于积分的说明 14077904
捐赠科研通 4432951
什么是DOI,文献DOI怎么找? 2433919
邀请新用户注册赠送积分活动 1426111
关于科研通互助平台的介绍 1404733