亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Arabic Lip Reading With Limited Data Using Deep Learning

计算机科学 分类器(UML) 人工智能 视位 语音识别 卷积神经网络 模式识别(心理学) 阿拉伯语 深度学习 语音处理 声学模型 语言学 哲学
作者
Zamen Jabr,Sauleh Etemadi,Nasser Mozayani
出处
期刊:IEEE Access [Institute of Electrical and Electronics Engineers]
卷期号:12: 111611-111626
标识
DOI:10.1109/access.2024.3440646
摘要

Two main challenges faced by deep learning systems are related to the amount of data and the complexity of the model concerning the number and type of layers and the number of training parameters. In this paper, we propose an End-to-End Arabic lip-reading system that can be trained on a limited dataset, which combines a visual model consist of Convolutional Neural Networks (CNNs) and a temporal model Gated Recurrent Units (GRUs ) layers, taking into account the balance between the size of the dataset and the number of model parameters. For this purpose, we created a limited Arabic dataset that involved 20 words uttered by 40 native Arabic speakers; then, we exploited the redundant frames found in video sequences to train the Arabic visemes classifier separately. This classifier was later used as a visual model, as a pre-trained model, in our end-to-end system to extract the spatial features from videos, while the temporal model was used to process the context. Our proposed method is evaluated on 1) our dataset, we obtained an accuracy equal to 83.02%; 2) the W. Dweik et al. dataset [1], we obtained an improvement rate of ≈ 3% on the result recorded by their work. In addition, we employed the visemes classifier model for person identification using the viseme shape and obtained a high result.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
顾矜应助山屿采纳,获得10
4秒前
20秒前
山屿完成签到,获得积分20
20秒前
Skyler发布了新的文献求助10
25秒前
39秒前
54秒前
llll发布了新的文献求助10
1分钟前
Skyler关注了科研通微信公众号
1分钟前
1分钟前
ruru123发布了新的文献求助10
1分钟前
酷炫远山完成签到 ,获得积分10
1分钟前
华仔应助ruru123采纳,获得10
1分钟前
2分钟前
Wang完成签到 ,获得积分20
2分钟前
yfz完成签到,获得积分10
2分钟前
li完成签到,获得积分10
3分钟前
3分钟前
3分钟前
lili发布了新的文献求助10
3分钟前
义气静丹完成签到,获得积分20
3分钟前
Wei完成签到 ,获得积分0
3分钟前
ramsey33完成签到 ,获得积分10
3分钟前
3分钟前
ruru123发布了新的文献求助10
4分钟前
4分钟前
bkagyin应助ruru123采纳,获得10
4分钟前
4分钟前
善良思松完成签到,获得积分10
5分钟前
xiaoyinni应助科研通管家采纳,获得20
5分钟前
早睡早起身体好Q完成签到 ,获得积分10
5分钟前
5分钟前
量子星尘发布了新的文献求助10
5分钟前
cuihao发布了新的文献求助10
6分钟前
健壮的花瓣完成签到 ,获得积分10
6分钟前
6分钟前
6分钟前
ruru123发布了新的文献求助10
6分钟前
科目三应助ruru123采纳,获得10
6分钟前
kelsiwang应助llll采纳,获得10
6分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Einführung in die Rechtsphilosophie und Rechtstheorie der Gegenwart 1500
Cowries - A Guide to the Gastropod Family Cypraeidae 1200
“Now I Have My Own Key”: The Impact of Housing Stability on Recovery and Recidivism Reduction Using a Recovery Capital Framework 500
The Red Peril Explained: Every Man, Woman & Child Affected 400
The Social Work Ethics Casebook(2nd,Frederic G. Reamer) 400
RF and Microwave Power Amplifiers 300
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 5019614
求助须知:如何正确求助?哪些是违规求助? 4258477
关于积分的说明 13271206
捐赠科研通 4063497
什么是DOI,文献DOI怎么找? 2222616
邀请新用户注册赠送积分活动 1231670
关于科研通互助平台的介绍 1154909