Evolutionary-scale prediction of atomic-level protein structure with a language model

基因组 推论 计算机科学 蛋白质结构预测 构造(python库) 蛋白质结构 序列(生物学) 人工智能 比例(比率) 机器学习 计算生物学 生物 遗传学 地理 地图学 生物化学 基因 程序设计语言
作者
Zeming Lin,Halil Akin,Roshan Rao,Brian Hie,Zhongkai Zhu,Wenting Lu,Nikita Smetanin,Robert Verkuil,Ori Kabeli,Yaniv Shmueli,Allan dos Santos Costa,Maryam Fazel-Zarandi,Tom Sercu,Salvatore Candido,Alexander Rives
出处
期刊:Science [American Association for the Advancement of Science]
卷期号:379 (6637): 1123-1130 被引量:2690
标识
DOI:10.1126/science.ade2574
摘要

Recent advances in machine learning have leveraged evolutionary information in multiple sequence alignments to predict protein structure. We demonstrate direct inference of full atomic-level protein structure from primary sequence using a large language model. As language models of protein sequences are scaled up to 15 billion parameters, an atomic-resolution picture of protein structure emerges in the learned representations. This results in an order-of-magnitude acceleration of high-resolution structure prediction, which enables large-scale structural characterization of metagenomic proteins. We apply this capability to construct the ESM Metagenomic Atlas by predicting structures for >617 million metagenomic protein sequences, including >225 million that are predicted with high confidence, which gives a view into the vast breadth and diversity of natural proteins.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
zybbb完成签到 ,获得积分10
1秒前
快来拾糖完成签到 ,获得积分10
2秒前
斯文听南发布了新的文献求助10
2秒前
ephore应助多情山蝶采纳,获得50
3秒前
wanci应助wildeager采纳,获得10
7秒前
郑仲禹完成签到 ,获得积分10
9秒前
彭于晏应助务实雪珍采纳,获得50
10秒前
烂漫映之完成签到 ,获得积分10
12秒前
城南她似海完成签到 ,获得积分10
12秒前
Xiaosi完成签到 ,获得积分10
13秒前
asd完成签到 ,获得积分20
15秒前
LILI完成签到,获得积分10
17秒前
20秒前
大大的西瓜完成签到 ,获得积分10
22秒前
大模型应助hikari采纳,获得10
24秒前
科研通AI2S应助小远采纳,获得10
25秒前
26秒前
犹豫笑旋发布了新的文献求助10
26秒前
潇洒乾完成签到 ,获得积分10
27秒前
动人的怀柔完成签到,获得积分10
27秒前
小马甲应助CoCoCat采纳,获得10
28秒前
1111完成签到 ,获得积分10
28秒前
风月难安完成签到,获得积分20
30秒前
gong发布了新的文献求助20
31秒前
夏xia完成签到 ,获得积分10
34秒前
35秒前
herococa应助沙维荣采纳,获得10
35秒前
37秒前
坚强的翠霜完成签到 ,获得积分10
38秒前
Jacky应助科研通管家采纳,获得10
39秒前
科研通AI6应助科研通管家采纳,获得10
39秒前
科目三应助科研通管家采纳,获得10
39秒前
华仔应助科研通管家采纳,获得10
39秒前
斯文败类应助科研通管家采纳,获得10
39秒前
39秒前
小远发布了新的文献求助10
40秒前
程瑶瑶瑶完成签到 ,获得积分10
40秒前
犹豫笑旋完成签到,获得积分10
42秒前
直率小霜完成签到,获得积分10
42秒前
syc发布了新的文献求助10
42秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
求中国石油大学(北京)图书馆的硕士论文,作者董晨,十年前搞太赫兹的 500
Vertebrate Palaeontology, 5th Edition 500
Narrative Method and Narrative form in Masaccio's Tribute Money 500
Aircraft Engine Design, Third Edition 500
Neonatal and Pediatric ECMO Simulation Scenarios 500
苏州地下水中新污染物及其转化产物的非靶向筛查 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4775817
求助须知:如何正确求助?哪些是违规求助? 4107972
关于积分的说明 12707328
捐赠科研通 3829092
什么是DOI,文献DOI怎么找? 2112437
邀请新用户注册赠送积分活动 1136244
关于科研通互助平台的介绍 1019939