Speech emotion recognition based on convolutional neural network with attention-based bidirectional long short-term memory network and multi-task learning

计算机科学 光谱图 卷积神经网络 任务(项目管理) 一般化 人工智能 人工神经网络 语音识别 深度学习 特征(语言学) 滤波器(信号处理) 频道(广播) 模式识别(心理学) 计算机视觉 工程类 数学 语言学 数学分析 哲学 系统工程 计算机网络
作者
Zhentao Liu,Mengting Han,Bao-Han Wu,Abdul Rehman
出处
期刊:Applied Acoustics [Elsevier]
卷期号:202: 109178-109178 被引量:19
标识
DOI:10.1016/j.apacoust.2022.109178
摘要

Speech emotion recognition (SER) is a challenging task since the distribution of the features is different among various people. To improve generalization performance and accuracy of SER, we employ balanced augmented sampling on the triple-channel log-Mel spectrograms to improve the imbalance of the sample distribution among emotional categories and provide sufficient inputs for the deep neural network model. Time-domain filter and frequency-domain filter are used to process the triple-channel log-Mel spectrograms respectively in order to increase the diversity of features. After that, a deep neural network composed of convolutional neural network (CNN) and attention-based bidirectional long short-term memory network (ABLSTM) is employed for feature extraction, in which multi-task learning is adopted to improve the performance of the deep neural network. We select seven auxiliary tasks and determine the optimal auxiliary tasks through experimental comparison. Finally, our method is evaluated on IEMOCAP and MSP-IMPROV database, and it achieves 70.27% and 66.27% in terms of WAR and UAR on IEMOCAP database, while the WAR and UAR are 60.90% and 61.83% on MSP-IMPROV database respectively, which demonstrates its better performance than other works.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
羞涩的大象完成签到,获得积分10
刚刚
zhangzhuopu发布了新的文献求助10
1秒前
2秒前
2秒前
3秒前
4秒前
4秒前
4秒前
甜甜秋完成签到 ,获得积分10
5秒前
5秒前
Rolo完成签到,获得积分10
6秒前
sxy发布了新的文献求助10
6秒前
yangfeidong发布了新的文献求助10
8秒前
9秒前
keyllllllr发布了新的文献求助20
9秒前
紫金大萝卜举报英勇绮南求助涉嫌违规
10秒前
斯文败类应助富贵小粉猪采纳,获得10
11秒前
12秒前
13秒前
14秒前
zlx完成签到,获得积分10
14秒前
15秒前
onfire完成签到,获得积分10
15秒前
研友_VZG7GZ应助QIAO采纳,获得10
15秒前
纪以筠发布了新的文献求助10
16秒前
smottom应助研友_LN32Mn采纳,获得10
17秒前
郭郭完成签到,获得积分10
17秒前
酷波er应助火星上香菇采纳,获得10
19秒前
山山而川发布了新的文献求助10
20秒前
20秒前
陌路应助Yxy采纳,获得30
21秒前
21秒前
BH应助天水碧采纳,获得10
22秒前
大模型应助暴躁的傲松采纳,获得10
23秒前
24秒前
TU完成签到,获得积分10
26秒前
26秒前
Rebecca发布了新的文献求助10
26秒前
学术天才发布了新的文献求助10
27秒前
xxx_HAN发布了新的文献求助10
27秒前
高分求助中
【本贴是提醒信息,请勿应助】请在求助之前详细阅读求助说明!!!! 20000
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 1000
The Three Stars Each: The Astrolabes and Related Texts 900
Yuwu Song, Biographical Dictionary of the People's Republic of China 800
Multifunctional Agriculture, A New Paradigm for European Agriculture and Rural Development 600
Bernd Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
A radiographic standard of reference for the growing knee 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2480462
求助须知:如何正确求助?哪些是违规求助? 2143007
关于积分的说明 5464750
捐赠科研通 1865789
什么是DOI,文献DOI怎么找? 927430
版权声明 562931
科研通“疑难数据库(出版商)”最低求助积分说明 496183