发布文献求助

Conformer-Based Self-Supervised Learning for Non-Speech Audio Tasks

计算机科学水准点（测量）代表（政治）人工智能监督学习机器学习多样性（控制论）半监督学习语音识别特征学习自然语言处理人工神经网络大地测量学政治政治学法学地理

作者

Sangeeta Srivastava,Yun Wang,Andros Tjandra,Anurag Kumar,Chunxi Liu,Kritika Singh,Yatharth Saraf

出处

期刊：Cornell University - arXiv 日期：2021-01-01

链接

arxiv.org arxiv.org arxiv.org datacite.orgdoi.org

标识

DOI：10.48550/arxiv.2110.07313

摘要

Representation learning from unlabeled data has been of major interest in artificial intelligence research. While self-supervised speech representation learning has been popular in the speech research community, very few works have comprehensively analyzed audio representation learning for non-speech audio tasks. In this paper, we propose a self-supervised audio representation learning method and apply it to a variety of downstream non-speech audio tasks. We combine the well-known wav2vec 2.0 framework, which has shown success in self-supervised learning for speech tasks, with parameter-efficient conformer architectures. Our self-supervised pre-training can reduce the need for labeled data by two-thirds. On the AudioSet benchmark, we achieve a mean average precision (mAP) score of 0.415, which is a new state-of-the-art on this dataset through audio-only self-supervised learning. Our fine-tuned conformers also surpass or match the performance of previous systems pre-trained in a supervised way on several downstream tasks. We further discuss the important design considerations for both pre-training and fine-tuning.

求助该文献

科研通智能强力驱动
Strongly Powered by AbleSci AI

我的文献求助列表浏览历史

一分钟了解求助规则 | 捐赠本站 | 历史今天

更新

2025年影响因子查询已上线 (2025-6-18)

更新

PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台，具备全网最快的应助速度，最高的求助完成率。对每一个文献求助，科研通都将尽心尽力，给求助人一个满意的交代。

实时播报: 谦让汝燕完成签到，获得积分10

刚刚; 现实的日记本完成签到，获得积分10

2秒前; 韭黄发布了新的文献求助10

2秒前; 科研通AI5的应助被支雨泽采纳，获得10

3秒前; 英勇的红酒完成签到，获得积分10

4秒前; 量子星尘发布了新的文献求助150

5秒前; 马儿饿了要吃草完成签到，获得积分10

5秒前; 乔治完成签到，获得积分10

8秒前; 坦率的棒棒糖完成签到，获得积分10

11秒前; 牧长一完成签到，获得积分0

11秒前; 荔枝励志完成签到，获得积分10

12秒前; roger完成签到，获得积分10

12秒前; 万能图书馆的应助被Swait采纳，获得10

13秒前; 小高同学完成签到，获得积分10

14秒前; 岁末完成签到，获得积分10

14秒前; 无敌科研大王完成签到，获得积分10

17秒前; 薄荷小新完成签到，获得积分10

17秒前; 韭黄发布了新的文献求助10

19秒前; X17完成签到，获得积分10

19秒前; 从容傲柏完成签到，获得积分10

19秒前; 英吉利25发布了新的文献求助20

20秒前; 华仔上传了应助文件

21秒前; ppapp完成签到，获得积分10

21秒前; 万能图书馆上传了应助文件

22秒前; 又又完成签到，获得积分10

22秒前; Ashley完成签到，获得积分10

24秒前; 孙孙孙啊完成签到，获得积分10

24秒前; 量子星尘发布了新的文献求助10

24秒前; 严念桃完成签到，获得积分0

24秒前; 王可欣完成签到，获得积分10

25秒前; Much完成签到，获得积分10

25秒前; aaaa发布了新的文献求助10

26秒前; 花卷完成签到，获得积分10

26秒前; 韭黄完成签到，获得积分20

27秒前; Swait发布了新的文献求助10

27秒前; CT发布了新的文献求助10

27秒前; 相南相北完成签到，获得积分10

27秒前; 訫藍完成签到，获得积分10

28秒前; 雷霆康康完成签到，获得积分10

28秒前; wsqg123完成签到，获得积分10

29秒前

高分求助中: (应助此贴封号)【重要！！请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000; Einführung in die Rechtsphilosophie und Rechtstheorie der Gegenwart 1500; NMR in Plants and Soils: New Developments in Time-domain NMR and Imaging 600; Electrochemistry: Volume 17 600; Physical Chemistry: How Chemistry Works 500; SOLUTIONS Adhesive restoration techniques restorative and integrated surgical procedures 500; Energy-Size Reduction Relationships In Comminution 500

热门求助领域（近24小时）

热门帖子: 关注科研通微信公众号，转发送积分 4952372; 求助须知：如何正确求助？哪些是违规求助？ 4215173; 关于积分的说明 13111456; 捐赠科研通 3997149; 什么是DOI，文献DOI怎么找？ 2187760; 邀请新用户注册赠送积分活动 1202987; 关于科研通互助平台的介绍 1115740

今日热心研友

哆啦的空间站

淡淡的南风

淡然的妙芙

注：热心度 = 本日应助数 + 本日被采纳获取积分÷10

Copyright © 2020-2025 AbleSci.COM, 科研通, All Right Reserved

科研通是非营利科研互助平台，不忘初心，为科研助力

本站互助的所有文件仅供个人学习研究用，禁止任何人把求助的所得文献进行盈利或传播

皖ICP备2024041134号-1

皖公网安备34019202002308

科研通【文献互助QQ群】：如果您有特殊求助，或发布求助超过24小时未得到应助，可加群求助，群号：941272744【点击一键加群】

科研通【志愿服务QQ群】：如果您热爱文献互助，有热心愿意为更多人服务，请加入小伙伴群，点击申请加入

关注微信服务号

科研通