A Data-Based Perspective on Transfer Learning

学习迁移 计算机科学 源代码 透视图(图形) 多样性(控制论) 编码(集合论) 数据源 人工智能 机器学习 情报检索 程序设计语言 集合(抽象数据类型)
作者
Saachi Jain,Hadi Salman,Alaa Khaddaj,Eric Wong,Sung Min Park,Aleksander Mądry
标识
DOI:10.1109/cvpr52729.2023.00352
摘要

It is commonly believed that in transfer learning including more pre-training data translates into better performance. However, recent evidence suggests that removing data from the source dataset can actually help too. In this work, we take a closer look at the role of the source dataset's composition in transfer learning and present a framework for probing its impact on downstream performance. Our framework gives rise to new capabilities such as pinpointing transfer learning brittleness as well as detecting pathologies such as data-leakage and the presence of misleading examples in the source dataset. In particular, we demonstrate that removing detrimental datapoints identified by our framework indeed improves transfer learning performance from ImageNet on a variety of target tasks. 1 1 Code is available at https://github.com/MadryLab/data-transfer
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
香菜包发布了新的文献求助10
2秒前
Shilohyin完成签到,获得积分10
2秒前
shuoliu完成签到 ,获得积分10
3秒前
黄加豪完成签到,获得积分10
6秒前
qql完成签到,获得积分10
8秒前
8秒前
Nancy发布了新的文献求助10
8秒前
8秒前
9秒前
Ava应助科研通管家采纳,获得10
9秒前
迷人的如南完成签到 ,获得积分10
9秒前
在水一方应助科研通管家采纳,获得10
9秒前
海蓝云天应助科研通管家采纳,获得10
9秒前
所所应助科研通管家采纳,获得10
9秒前
乐乐应助科研通管家采纳,获得10
9秒前
9秒前
美蛙鱼头头头头完成签到,获得积分20
9秒前
斯文败类应助刘赤赤采纳,获得10
12秒前
Jasper应助会笑的黑猫采纳,获得10
12秒前
13秒前
mindi应助美蛙鱼头头头头采纳,获得10
13秒前
13秒前
13秒前
桃桃曜发布了新的文献求助15
14秒前
15秒前
16秒前
Rrr完成签到,获得积分10
16秒前
17秒前
18秒前
18秒前
19秒前
红姐1993发布了新的文献求助10
19秒前
英俊的铭应助pkuwen采纳,获得10
20秒前
qingde完成签到,获得积分10
20秒前
20秒前
舒适的采波完成签到,获得积分10
20秒前
liaosion完成签到,获得积分10
21秒前
21秒前
21秒前
22秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
PowerCascade: A Synthetic Dataset for Cascading Failure Analysis in Power Systems 2000
Picture this! Including first nations fiction picture books in school library collections 1500
Signals, Systems, and Signal Processing 610
Unlocking Chemical Thinking: Reimagining Chemistry Teaching and Learning 555
CLSI M100 Performance Standards for Antimicrobial Susceptibility Testing 36th edition 400
How to Design and Conduct an Experiment and Write a Lab Report: Your Complete Guide to the Scientific Method (Step-by-Step Study Skills) 333
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6363390
求助须知:如何正确求助?哪些是违规求助? 8177282
关于积分的说明 17232356
捐赠科研通 5418457
什么是DOI,文献DOI怎么找? 2867061
邀请新用户注册赠送积分活动 1844285
关于科研通互助平台的介绍 1691850