亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

An Empirical Study of Pre-Trained Model Reuse in the Hugging Face Deep Learning Model Registry

重新使用 计算机科学 软件可移植性 软件工程 人工智能 标准化 数据科学 机器学习 软件 依赖关系(UML) 工程类 操作系统 程序设计语言 废物管理
作者
Wenxin Jiang,Nicholas Synovic,Matt Hyatt,Taylor R. Schorlemmer,Rohan Sethi,Yung‐Hsiang Lu,George K. Thiruvathukal,James C. Davis
标识
DOI:10.1109/icse48619.2023.00206
摘要

Deep Neural Networks (DNNs) are being adopted as components in software systems. Creating and specializing DNNs from scratch has grown increasingly difficult as state-of-the-art architectures grow more complex. Following the path of traditional software engineering, machine learning engineers have begun to reuse large-scale pre-trained models (PTMs) and fine-tune these models for downstream tasks. Prior works have studied reuse practices for traditional software packages to guide software engineers towards better package maintenance and dependency management. We lack a similar foundation of knowledge to guide behaviors in pre-trained model ecosystems. In this work, we present the first empirical investigation of PTM reuse. We interviewed 12 practitioners from the most popular PTM ecosystem, Hugging Face, to learn the practices and challenges of PTM reuse. From this data, we model the decision-making process for PTM reuse. Based on the identified practices, we describe useful attributes for model reuse, including provenance, reproducibility, and portability. Three challenges for PTM reuse are missing attributes, discrepancies between claimed and actual performance, and model risks. We substantiate these identified challenges with systematic measurements in the Hugging Face ecosystem. Our work informs future directions on optimizing deep learning ecosystems by automated measuring useful attributes and potential attacks, and envision future research on infrastructure and standardization for model registries.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Eve完成签到,获得积分20
28秒前
kingcoming完成签到,获得积分10
37秒前
大模型应助科研通管家采纳,获得10
1分钟前
2分钟前
把的蛮耐得烦完成签到 ,获得积分10
2分钟前
刘森哺发布了新的文献求助50
2分钟前
轻松的芯完成签到 ,获得积分10
2分钟前
刘森哺完成签到,获得积分10
2分钟前
科研通AI2S应助科研通管家采纳,获得10
3分钟前
淡定的井完成签到,获得积分20
3分钟前
在水一方应助lydia采纳,获得10
3分钟前
silsotiscolor完成签到,获得积分10
4分钟前
852应助啥也不会采纳,获得30
4分钟前
南宫古伦完成签到 ,获得积分10
4分钟前
4分钟前
啥也不会发布了新的文献求助30
4分钟前
小蘑菇应助zm采纳,获得10
5分钟前
小二郎应助科研通管家采纳,获得10
5分钟前
啥也不会完成签到,获得积分10
5分钟前
lanbing802发布了新的文献求助10
5分钟前
5分钟前
小羊同学发布了新的文献求助10
6分钟前
小羊同学完成签到,获得积分10
6分钟前
6分钟前
lydia发布了新的文献求助10
6分钟前
重要元灵完成签到 ,获得积分10
6分钟前
沉静完成签到 ,获得积分10
7分钟前
lydia完成签到,获得积分10
7分钟前
小尾巴发布了新的文献求助20
7分钟前
孟筱完成签到 ,获得积分10
8分钟前
lanbing802发布了新的文献求助10
8分钟前
Hello应助mbxjsy采纳,获得20
8分钟前
pass完成签到 ,获得积分10
8分钟前
8分钟前
mbxjsy发布了新的文献求助20
8分钟前
白昼の月完成签到 ,获得积分0
8分钟前
小尾巴完成签到,获得积分10
8分钟前
科研通AI2S应助科研通管家采纳,获得10
9分钟前
汉堡包应助LiH采纳,获得10
10分钟前
lanbing802完成签到,获得积分10
10分钟前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Les Mantodea de Guyane Insecta, Polyneoptera 2500
Computational Atomic Physics for Kilonova Ejecta and Astrophysical Plasmas 500
Technologies supporting mass customization of apparel: A pilot project 450
Brain and Heart The Triumphs and Struggles of a Pediatric Neurosurgeon 400
Cybersecurity Blueprint – Transitioning to Tech 400
Mixing the elements of mass customisation 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3782682
求助须知:如何正确求助?哪些是违规求助? 3328076
关于积分的说明 10234318
捐赠科研通 3043042
什么是DOI,文献DOI怎么找? 1670442
邀请新用户注册赠送积分活动 799684
科研通“疑难数据库(出版商)”最低求助积分说明 758994