Voice activity detection system for smart earphones

计算机科学 耳机 估计员 水准点(测量) 语音识别 语音活动检测 噪音(视频) 能量(信号处理) 数字信号处理器 可靠性(半导体) 信噪比(成像) 背景噪声 数字信号处理 实时计算 人工智能 语音处理 工程类 功率(物理) 数学 计算机硬件 电信 统计 物理 电气工程 图像(数学) 量子力学 地理 大地测量学
作者
Narimene Lezzoum,Ghyslain Gagnon,Jérémie Voix
出处
期刊:IEEE Transactions on Consumer Electronics [Institute of Electrical and Electronics Engineers]
卷期号:60 (4): 737-744 被引量:18
标识
DOI:10.1109/tce.2014.7027350
摘要

This paper presents a real-time voice activity detection (VAD) algorithm implemented in a miniature Digital Signal Processor (DSP) for in-ear listening devices such as earphones or headphones. This system allows consumers to hear external speech signals such as public announcements or oral communication while listening to music without removing their listening devices. The proposed algorithm uses two normalized energy features that compare the energy in the frequency region containing speech information with the frequency regions typically containing noise. The extraction of the normalized features represents the key of the proposed VAD since it eliminates the need for a signal-to-noise ratio (SNR) estimator. The VAD's decision is made using two threshold comparison rules computed from the normalized features and a hangover scheme triggered after a given number of observations. The algorithm parameters, namely the frequency regions' boundaries, number of observations, two decision thresholds and hangover's duration, have been optimized offline using a genetic algorithm. The performance of the proposed VAD is compared to a benchmark algorithm in four noise environments and three SNRs. Results show that the average false positive rate (FPR) of the proposed algorithm is 4.2% and the average true positive rate (TPR) is 91.4 % compared to the benchmark algorithm which has a FPR average of 29.9 % and a TPR average of 79.0 %. The proposed VAD is implemented in hardware to validate its reliability and complexity.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
现代的完成签到,获得积分10
刚刚
chuxin发布了新的文献求助10
1秒前
852应助taster采纳,获得30
2秒前
大盆友yu发布了新的文献求助10
2秒前
星辰大海应助猪头军师采纳,获得10
2秒前
十八发布了新的文献求助10
2秒前
星辰大海应助liuheqian采纳,获得10
2秒前
hhh发布了新的文献求助10
3秒前
勤劳三问完成签到,获得积分20
3秒前
小周周完成签到 ,获得积分10
3秒前
CipherSage应助圆圆采纳,获得10
3秒前
4秒前
shibin完成签到,获得积分10
5秒前
6秒前
7秒前
7秒前
7秒前
lvlulu21完成签到,获得积分10
7秒前
无产阶级科学者完成签到,获得积分10
8秒前
8秒前
zhuo发布了新的文献求助10
9秒前
9秒前
jingjinger发布了新的文献求助10
10秒前
JamesPei应助www采纳,获得10
11秒前
11秒前
11秒前
大盆友yu完成签到,获得积分10
13秒前
13秒前
13秒前
山城发布了新的文献求助10
13秒前
长安发布了新的文献求助10
13秒前
14秒前
冷酷雨关注了科研通微信公众号
15秒前
司马船长完成签到,获得积分10
15秒前
圆圆发布了新的文献求助10
15秒前
科目三应助123采纳,获得10
16秒前
16秒前
run发布了新的文献求助10
17秒前
lanhu完成签到 ,获得积分10
17秒前
星星发布了新的文献求助30
18秒前
高分求助中
【本贴是提醒信息,请勿应助】请在求助之前详细阅读求助说明!!!! 20000
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 1000
The Three Stars Each: The Astrolabes and Related Texts 900
Yuwu Song, Biographical Dictionary of the People's Republic of China 800
Multifunctional Agriculture, A New Paradigm for European Agriculture and Rural Development 600
Challenges, Strategies, and Resiliency in Disaster and Risk Management 500
Bernd Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2480963
求助须知:如何正确求助?哪些是违规求助? 2143487
关于积分的说明 5466581
捐赠科研通 1866164
什么是DOI,文献DOI怎么找? 927525
版权声明 562978
科研通“疑难数据库(出版商)”最低求助积分说明 496226