Depression recognition using voice-based pre-training model

计算机科学 二元分类 提取器 一般化 试验装置 训练集 均方误差 人工智能 特征(语言学) 集合(抽象数据类型) 萧条(经济学) 模式识别(心理学) 机器学习 语音识别 统计 数学 支持向量机 程序设计语言 数学分析 经济 宏观经济学 哲学 工程类 语言学 工艺工程
作者
Xiangsheng Huang,Fang Wang,Yuan Gao,Yilong Liao,Wenjing Zhang,Li Zhang,Zhenrong Xu
出处
期刊:Scientific Reports [Nature Portfolio]
卷期号:14 (1): 12734-12734 被引量:19
标识
DOI:10.1038/s41598-024-63556-0
摘要

Abstract The early screening of depression is highly beneficial for patients to obtain better diagnosis and treatment. While the effectiveness of utilizing voice data for depression detection has been demonstrated, the issue of insufficient dataset size remains unresolved. Therefore, we propose an artificial intelligence method to effectively identify depression. The wav2vec 2.0 voice-based pre-training model was used as a feature extractor to automatically extract high-quality voice features from raw audio. Additionally, a small fine-tuning network was used as a classification model to output depression classification results. Subsequently, the proposed model was fine-tuned on the DAIC-WOZ dataset and achieved excellent classification results. Notably, the model demonstrated outstanding performance in binary classification, attaining an accuracy of 0.9649 and an RMSE of 0.1875 on the test set. Similarly, impressive results were obtained in multi-classification, with an accuracy of 0.9481 and an RMSE of 0.3810. The wav2vec 2.0 model was first used for depression recognition and showed strong generalization ability. The method is simple, practical, and applicable, which can assist doctors in the early screening of depression.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Lucille发布了新的文献求助10
刚刚
上官若男应助Ulysses采纳,获得30
刚刚
刚刚
刘思琪发布了新的文献求助10
刚刚
1秒前
精灵半岛完成签到,获得积分10
1秒前
2秒前
2秒前
共享精神应助RIchard采纳,获得10
2秒前
3秒前
香蕉觅云应助thuuu采纳,获得10
4秒前
yizhu完成签到 ,获得积分10
4秒前
5秒前
只只只发布了新的文献求助10
5秒前
大个应助张玉建采纳,获得10
5秒前
假扮关注了科研通微信公众号
5秒前
6秒前
FashionBoy应助困于浪漫冬采纳,获得10
6秒前
你呀发布了新的文献求助10
7秒前
LiaoN发布了新的文献求助10
7秒前
英姑应助jun采纳,获得10
7秒前
7秒前
7秒前
7秒前
无极微光应助高贵振家采纳,获得20
8秒前
8秒前
李爱国应助命苦科研人采纳,获得10
8秒前
果果发布了新的文献求助10
8秒前
69完成签到,获得积分10
8秒前
8秒前
今后应助千陽采纳,获得10
8秒前
情怀应助车剑锋采纳,获得10
8秒前
8秒前
苹果易真完成签到,获得积分10
9秒前
hjw发布了新的文献求助10
9秒前
芋泥完成签到,获得积分10
10秒前
负责的蜜花完成签到,获得积分20
10秒前
10秒前
蚂蚁工人发布了新的文献求助10
11秒前
11秒前
高分求助中
卤化钙钛矿人工突触的研究 1000
Engineering for calcareous sediments : proceedings of the International Conference on Calcareous Sediments, Perth 15-18 March 1988 / edited by R.J. Jewell, D.C. Andrews 1000
Wolffs Headache and Other Head Pain 9th Edition 1000
Continuing Syntax 1000
Signals, Systems, and Signal Processing 510
Cardiac structure and function of elite volleyball players across different playing positions 500
CLSI H26-A2 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6242532
求助须知:如何正确求助?哪些是违规求助? 8066456
关于积分的说明 16836466
捐赠科研通 5320500
什么是DOI,文献DOI怎么找? 2833137
邀请新用户注册赠送积分活动 1810643
关于科研通互助平台的介绍 1666927