清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

GenSLMs: Genome-scale language models reveal SARS-CoV-2 evolutionary dynamics

基因组 比例(比率) 计算机科学 跟踪(教育) 2019年冠状病毒病(COVID-19) 进化动力学 严重急性呼吸综合征冠状病毒2型(SARS-CoV-2) 路径(计算) 动力学(音乐) 计算生物学 生物 基因 遗传学 地理 程序设计语言 物理 传染病(医学专业) 人口 教育学 病理 社会学 心理学 医学 人口学 地图学 疾病 声学
作者
Maxim Zvyagin,Alexander Brace,Kyle Hippe,Yuntian Deng,Bin Zhang,Cindy Orozco Bohorquez,Austin Clyde,Bharat Kale,Danilo Perez-Rivera,Huadóng Ma,Carla M. Mann,Michael Irvin,Defne G. Ozgulbas,Natalia Vassilieva,James Gregory Pauloski,Logan Ward,Valérie Hayot‐Sasson,Murali Emani,Sam Foreman,Zhen Xie,Diangen Lin,Maulik Shukla,Weili Nie,Josh Romero,Christian Dallago,Arash Vahdat,Chaowei Xiao,Thomas Gibbs,Ian Foster,James J. Davis,Michael E. Papka,Thomas Brettin,Rick Stevens,Anima Anandkumar,Venkatram Vishwanath,Arvind Ramanathan
出处
期刊:International Journal of High Performance Computing Applications [SAGE]
卷期号:37 (6): 683-705 被引量:4
标识
DOI:10.1177/10943420231201154
摘要

We seek to transform how new and emergent variants of pandemic-causing viruses, specifically SARS-CoV-2, are identified and classified. By adapting large language models (LLMs) for genomic data, we build genome-scale language models (GenSLMs) which can learn the evolutionary landscape of SARS-CoV-2 genomes. By pre-training on over 110 million prokaryotic gene sequences and fine-tuning a SARS-CoV-2-specific model on 1.5 million genomes, we show that GenSLMs can accurately and rapidly identify variants of concern. Thus, to our knowledge, GenSLMs represents one of the first whole-genome scale foundation models which can generalize to other prediction tasks. We demonstrate scaling of GenSLMs on GPU-based supercomputers and AI-hardware accelerators utilizing 1.63 Zettaflops in training runs with a sustained performance of 121 PFLOPS in mixed precision and peak of 850 PFLOPS. We present initial scientific insights from examining GenSLMs in tracking evolutionary dynamics of SARS-CoV-2, paving the path to realizing this on large biological data.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
7秒前
楚襄谷完成签到 ,获得积分10
12秒前
雷九万班完成签到 ,获得积分10
12秒前
28秒前
kuyi完成签到 ,获得积分10
30秒前
hxx发布了新的文献求助90
33秒前
缪清完成签到 ,获得积分10
39秒前
59秒前
1分钟前
wangyu发布了新的文献求助10
1分钟前
看看文章完成签到 ,获得积分10
1分钟前
充电宝应助wangyu采纳,获得10
1分钟前
斯文败类应助hxx采纳,获得80
1分钟前
iMoney完成签到 ,获得积分10
2分钟前
ycw7777完成签到,获得积分10
2分钟前
elisa828完成签到,获得积分10
2分钟前
2分钟前
DragonAca完成签到,获得积分10
2分钟前
wangyu发布了新的文献求助10
2分钟前
fengfenghao完成签到 ,获得积分10
3分钟前
4分钟前
4分钟前
lor完成签到,获得积分20
4分钟前
张老师完成签到,获得积分10
4分钟前
wx1完成签到 ,获得积分0
4分钟前
lor发布了新的文献求助10
4分钟前
曾经不言完成签到 ,获得积分10
4分钟前
SOLOMON应助派大星采纳,获得10
4分钟前
poki完成签到 ,获得积分10
4分钟前
宇文雨文完成签到 ,获得积分10
5分钟前
脑洞疼应助wangyu采纳,获得10
5分钟前
5分钟前
lj完成签到,获得积分10
5分钟前
wangyu发布了新的文献求助10
6分钟前
光亮乘云完成签到 ,获得积分10
6分钟前
SOLOMON应助科研通管家采纳,获得30
6分钟前
大刘完成签到 ,获得积分10
6分钟前
鱼鱼鱼完成签到,获得积分10
7分钟前
柒邪完成签到 ,获得积分10
7分钟前
陳某完成签到,获得积分10
7分钟前
高分求助中
请在求助之前详细阅读求助说明!!!! 20000
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 1000
The Three Stars Each: The Astrolabes and Related Texts 900
Yuwu Song, Biographical Dictionary of the People's Republic of China 800
Multifunctional Agriculture, A New Paradigm for European Agriculture and Rural Development 600
Bernd Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
A radiographic standard of reference for the growing knee 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2478452
求助须知:如何正确求助?哪些是违规求助? 2141441
关于积分的说明 5458961
捐赠科研通 1864659
什么是DOI,文献DOI怎么找? 926966
版权声明 562912
科研通“疑难数据库(出版商)”最低求助积分说明 496023