清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Multimodal Emotion Recognition Using Feature Fusion: An LLM-Based Approach

计算机科学 情绪识别 人工智能 模式识别(心理学) 特征(语言学) 特征提取 融合 语音识别 计算机视觉 语言学 哲学
作者
Omkumar Chandraumakantham,N Gowtham,Mohammed Zakariah,Abdulaziz S. Almazyad
出处
期刊:IEEE Access [Institute of Electrical and Electronics Engineers]
卷期号:12: 108052-108071 被引量:18
标识
DOI:10.1109/access.2024.3425953
摘要

Multimodal emotion recognition is a developing field that analyzes emotions through various channels, mainly audio, video, and text. However, existing state-of-the-art systems focus on two to three modalities at the most, utilize traditional techniques, fail to consider emotional interplay, lack the scope to add more modalities, and aren’t efficient in predicting emotions accurately. This research proposes a novel approach using rule-based systems to convert non-verbal cues to text, inspired by a limited prior attempt that lacked proper benchmarking. It achieves efficient multimodal emotion recognition by utilizing distilRoBERTa, a large language model fine-tuned with a combined textual representation of audio (such as loudness, spectral flux, MFCCs, pitch stability, and emphasis) and visual features (action units) extracted from videos. This approach is evaluated using the datasets RAVDESS and BAUM-1. It achieves high accuracy (93.18% in RAVDESS and 93.69% in BAUM-1) on both datasets, performing on par with the SOTA (state-of-the-art) systems, if not slightly better. Furthermore, the research highlights the potential for incorporating additional modalities by transforming them into text using rule-based systems and utilizing them to refine further pre-trained large language models, giving rise to a more comprehensive approach to emotion recognition.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
坚定蘑菇完成签到 ,获得积分10
1秒前
Quency完成签到 ,获得积分10
3秒前
5秒前
clearsky发布了新的文献求助30
10秒前
orixero应助clearsky采纳,获得10
25秒前
刘传宏完成签到,获得积分10
36秒前
铃铛完成签到 ,获得积分10
38秒前
1分钟前
1分钟前
1分钟前
Mountain完成签到 ,获得积分10
1分钟前
1分钟前
典雅的纸飞机完成签到 ,获得积分10
2分钟前
gwbk完成签到,获得积分0
2分钟前
文献博士完成签到 ,获得积分10
2分钟前
Yss完成签到,获得积分10
2分钟前
哈哈完成签到,获得积分10
2分钟前
寒澈发布了新的文献求助10
2分钟前
林夏应助Yss采纳,获得10
2分钟前
隐形曼青应助Sylvia卉采纳,获得10
2分钟前
2分钟前
Sylvia卉发布了新的文献求助10
2分钟前
ChandlerZB完成签到,获得积分10
2分钟前
Thunnus001完成签到 ,获得积分10
2分钟前
今后应助Sylvia卉采纳,获得10
2分钟前
陶醉的烤鸡完成签到 ,获得积分10
3分钟前
科研通AI2S应助科研通管家采纳,获得10
3分钟前
smart_guy发布了新的文献求助20
3分钟前
kevin完成签到 ,获得积分10
3分钟前
wwdd完成签到,获得积分10
3分钟前
nav完成签到 ,获得积分10
3分钟前
Jasperlee完成签到 ,获得积分10
4分钟前
醉清风完成签到 ,获得积分10
4分钟前
4分钟前
chichenglin完成签到 ,获得积分0
4分钟前
Vintoe完成签到 ,获得积分10
4分钟前
123完成签到,获得积分10
4分钟前
Yayoioo完成签到 ,获得积分10
4分钟前
4分钟前
4分钟前
高分求助中
Entre Praga y Madrid: los contactos checoslovaco-españoles (1948-1977) 1000
Polymorphism and polytypism in crystals 1000
Signals, Systems, and Signal Processing 610
Discrete-Time Signals and Systems 610
Horngren's Cost Accounting A Managerial Emphasis 17th edition 600
Russian Politics Today: Stability and Fragility (2nd Edition) 500
Death Without End: Korea and the Thanatographics of War 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 纳米技术 有机化学 物理 生物化学 化学工程 计算机科学 复合材料 内科学 催化作用 光电子学 物理化学 电极 冶金 遗传学 细胞生物学
热门帖子
关注 科研通微信公众号,转发送积分 6087087
求助须知:如何正确求助?哪些是违规求助? 7916708
关于积分的说明 16377237
捐赠科研通 5220032
什么是DOI,文献DOI怎么找? 2790822
邀请新用户注册赠送积分活动 1774004
关于科研通互助平台的介绍 1649615