已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Gradformer: A Framework for Multi-Aspect Multi-Granularity Pronunciation Assessment

粒度 计算机科学 编码器 发音 变压器 相关性 语音识别 人工智能 数学 电压 哲学 语言学 物理 几何学 量子力学 操作系统
作者
Hao-Chen Pei,Hao Fang,Xin Luo,Xin-Shun Xu
出处
期刊:IEEE/ACM transactions on audio, speech, and language processing [Institute of Electrical and Electronics Engineers]
卷期号:32: 554-563 被引量:2
标识
DOI:10.1109/taslp.2023.3335807
摘要

Automatic pronunciation assessment is an indispensable technology in computer-assisted pronunciation training systems. To further evaluate the quality of pronunciation, multi-task learning with simultaneous output of multi-granularity and multi-aspect has become a mainstream solution. Existing methods either predict scores at all granularity levels simultaneously through a parallel structure, or predict individual granularity scores layer by layer through a hierarchical structure. However, these methods do not fully understand and take advantage of the correlation between the three granularity levels of phoneme, word, and utterance. To address this issue, we propose a novel method, Granularity-decoupled Transformer (Gradformer), which is able to model the relationships between multiple granularity levels. Specifically, we first use a convolution-augmented transformer encoder to encode acoustic features, where the convolution module helps the model better capture local information. The model outputs both phoneme- and word-level granularity scores with high correlation by the encoder. Then, we use utterance queries to interact with the output of the encoder through the transformer decoder, ultimately obtaining the utterance scores. Through unique encoder and decoder architecture, we achieve decoupling at three granularity levels, and handling the relationship between each granularity. Experiments on the speachocean762 dataset show that our model has advantages over state-of-the-art methods in various metrics, especially in key metrics such as phoneme accuracy, word accuracy, and total score.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
小六九发布了新的文献求助10
1秒前
1秒前
你好好好完成签到,获得积分10
3秒前
3秒前
我想放假完成签到 ,获得积分10
5秒前
XP完成签到,获得积分10
5秒前
DD完成签到 ,获得积分10
5秒前
RerrentLinden完成签到,获得积分10
6秒前
SUN完成签到,获得积分10
6秒前
6秒前
XP发布了新的文献求助30
7秒前
勤劳的冰菱完成签到,获得积分10
9秒前
10秒前
伊萨卡完成签到 ,获得积分10
11秒前
Miku完成签到,获得积分10
12秒前
yangdan发布了新的文献求助10
12秒前
简单的沛蓝完成签到 ,获得积分10
13秒前
Nakacoke77完成签到,获得积分10
13秒前
14秒前
Sunday完成签到 ,获得积分10
15秒前
王雨辰发布了新的文献求助10
15秒前
Zhuzhu完成签到 ,获得积分10
16秒前
不学习的牛蛙完成签到 ,获得积分10
16秒前
fwda1000完成签到 ,获得积分10
18秒前
18秒前
19秒前
19秒前
小六九完成签到 ,获得积分10
19秒前
顺心靖雁完成签到,获得积分10
20秒前
xylor完成签到,获得积分10
20秒前
谷子完成签到 ,获得积分10
22秒前
22秒前
McbxM发布了新的文献求助10
22秒前
23秒前
24秒前
嗯嗯完成签到 ,获得积分10
25秒前
25秒前
zhangzhenwen1204完成签到 ,获得积分10
25秒前
GUAN发布了新的文献求助10
26秒前
Axel完成签到,获得积分10
26秒前
高分求助中
Les Mantodea de Guyane Insecta, Polyneoptera 2500
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 (PDF!) 1000
Technologies supporting mass customization of apparel: A pilot project 450
A Field Guide to the Amphibians and Reptiles of Madagascar - Frank Glaw and Miguel Vences - 3rd Edition 400
China Gadabouts: New Frontiers of Humanitarian Nursing, 1941–51 400
The Healthy Socialist Life in Maoist China, 1949–1980 400
Walking a Tightrope: Memories of Wu Jieping, Personal Physician to China's Leaders 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3788117
求助须知:如何正确求助?哪些是违规求助? 3333604
关于积分的说明 10262585
捐赠科研通 3049416
什么是DOI,文献DOI怎么找? 1673545
邀请新用户注册赠送积分活动 802042
科研通“疑难数据库(出版商)”最低求助积分说明 760477