ARawNet: A Lightweight Solution for Leveraging Raw Waveforms in Spoof Speech Detection

计算机科学 波形 编码器 语音识别 钥匙(锁) 灵活性(工程) 人工智能 补语(音乐) 语音活动检测 语音处理 机器学习 模式识别(心理学) 表型 数学 雷达 计算机安全 互补 化学 生物化学 操作系统 统计 基因 电信
作者
Zhongwei Teng,Quchen Fu,Jules White,Maria Powell,Douglas C. Schmidt
标识
DOI:10.1109/icpr56361.2022.9956138
摘要

An emerging trend in audio processing is capturing low-level speech representations from raw waveforms. These representations have shown promising results on a variety of tasks, such as speech recognition and speech separation. Compared to handcrafted features, learning speech features via backpropagation can potentially provide the model greater flexibility in how it represents data for different tasks. However, results from empirical studies show that, in some tasks, such as spoof speech detection, handcrafted features still currently outperform learned features. Instead of evaluating handcrafted features and raw waveforms independently, this paper proposes an Auxiliary Rawnet model to complement handcrafted features with features learned from raw waveforms for spoof speech detection. A key benefit of the approach is that it can improve accuracy at a relatively low computational cost. The proposed Auxiliary Rawnet model is tested using the ASVspoof 2019 dataset and pooled EER and min-tDCF are 1.11% and 0.03645 respectively. Results from this dataset indicate that a lightweight waveform encoder can boost the performance of handcrafted-features-based encoders for 10 types of spoof attacks, including 3 challenging attacks, in exchange for a small amount of additional computational work.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
认真子默发布了新的文献求助10
3秒前
7秒前
英俊的铭应助Gulu_采纳,获得10
8秒前
沉静的八宝粥完成签到,获得积分10
12秒前
嘿嘿你猜发布了新的文献求助10
14秒前
miao完成签到,获得积分10
14秒前
香蕉觅云应助呱呱呱采纳,获得10
15秒前
16秒前
20秒前
FashionBoy应助有你采纳,获得10
24秒前
journey_qq发布了新的文献求助10
24秒前
24秒前
25秒前
科里斯皮尔应助Leayu采纳,获得10
25秒前
26秒前
27秒前
29秒前
万能图书馆应助喵喵姚采纳,获得10
32秒前
33秒前
33秒前
34秒前
xiao发布了新的文献求助10
34秒前
sky123应助健壮数据线采纳,获得10
35秒前
有你发布了新的文献求助10
36秒前
37秒前
39秒前
40秒前
是瓜瓜不完成签到,获得积分10
41秒前
42秒前
研友_r8YKvn完成签到,获得积分10
43秒前
css发布了新的文献求助10
45秒前
忧心的行云完成签到 ,获得积分10
46秒前
研友_VZG7GZ应助颠覆乾坤采纳,获得10
48秒前
huangqian完成签到,获得积分10
49秒前
东方雨季完成签到,获得积分10
53秒前
54秒前
阿刁完成签到,获得积分10
55秒前
57秒前
57秒前
高分求助中
请在求助之前详细阅读求助说明!!!! 20000
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 1000
Sphäroguß als Werkstoff für Behälter zur Beförderung, Zwischen- und Endlagerung radioaktiver Stoffe - Untersuchung zu alternativen Eignungsnachweisen: Zusammenfassender Abschlußbericht 1000
Yuwu Song, Biographical Dictionary of the People's Republic of China 700
[Lambert-Eaton syndrome without calcium channel autoantibodies] 520
The Three Stars Each: The Astrolabes and Related Texts 500
Additive Manufacturing Design and Applications 320
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2466932
求助须知:如何正确求助?哪些是违规求助? 2135095
关于积分的说明 5440635
捐赠科研通 1860171
什么是DOI,文献DOI怎么找? 925231
版权声明 562640
科研通“疑难数据库(出版商)”最低求助积分说明 494983