Mel倒谱
语音识别
计算机科学
倒谱
短时记忆
人工智能
模式识别(心理学)
特征提取
人工神经网络
循环神经网络
作者
A-Hyeon Jo,Keun-Chang Kwak
出处
期刊:Journal of Korean Institute of Information Technology
[Korean Institute of Information Technology]
日期:2022-01-31
卷期号:20 (1): 1-10
标识
DOI:10.14801/jkiit.2022.20.1.1
摘要
우울증은 개인의 전반적인 삶에 영향을 주고 감정, 생각, 신체 상태, 그리고 행동 등에 변화를 일으키는 심각한 정신질환이다. 따라서 우울증을 초기에 정확하게 진단하는 것이 중요하고 이를 위해 딥러닝을 이용한 여러 가지 시스템 개발되고 있다. 본 논문에서는 음성신호를 이용하여 Bi-LSTM(Bi-directional Long Short-Term Memory) 기반 우울증 진단을 위한 딥러닝 모델을 제안하고 성능을 비교하고 분석한다. 학습에는 딥러닝 모델 중 하나인 Bi-LSTM 모델을 사용했다. 음성신호의 특징은 MFCC(Mel-Frequency Cepstral Coefficient), GTCC(Gammatone Cepstral Coefficients)를 이용해 추출했고, 클래스 불균형을 해결하기 위해 데이터 확장을 수행했다. 데이터 확장 전 Bi-LSTM 모델의 성능은 약 56.58%였고, 확장 후의 성능은 약 98.49%로 학습데이터 확장을 통해 클래스 불균형 문제를 해결함으로써 모델의 분류 성능을 개선했다.
科研通智能强力驱动
Strongly Powered by AbleSci AI