亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Evolutionary-scale prediction of atomic level protein structure with a language model

语言模型 计算机科学 推论 比例(比率) 蛋白质结构预测 人工智能 蛋白质结构 机器学习 数据挖掘 地理 生物 地图学 生物化学
作者
Zeming Lin,Halil Akin,Roshan Rao,Brian Hie,Zhongkai Zhu,Wenting Lu,Nikita Smetanin,Robert Verkuil,Ori Kabeli,Yaniv Shmueli,Allan dos Santos Costa,Maryam Fazel-Zarandi,Tom Sercu,Salvatore Candido,Alexander Rives
标识
DOI:10.1101/2022.07.20.500902
摘要

Abstract Artificial intelligence has the potential to open insight into the structure of proteins at the scale of evolution. It has only recently been possible to extend protein structure prediction to two hundred million cataloged proteins. Characterizing the structures of the exponentially growing billions of protein sequences revealed by large scale gene sequencing experiments would necessitate a break-through in the speed of folding. Here we show that direct inference of structure from primary sequence using a large language model enables an order of magnitude speed-up in high resolution structure prediction. Leveraging the insight that language models learn evolutionary patterns across millions of sequences, we train models up to 15B parameters, the largest language model of proteins to date. As the language models are scaled they learn information that enables prediction of the three-dimensional structure of a protein at the resolution of individual atoms. This results in prediction that is up to 60x faster than state-of-the-art while maintaining resolution and accuracy. Building on this, we present the ESM Metage-nomic Atlas. This is the first large-scale structural characterization of metagenomic proteins, with more than 617 million structures. The atlas reveals more than 225 million high confidence predictions, including millions whose structures are novel in comparison with experimentally determined structures, giving an unprecedented view into the vast breadth and diversity of the structures of some of the least understood proteins on earth.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
8秒前
你雕姐发布了新的文献求助10
11秒前
你雕姐完成签到,获得积分10
29秒前
hugo完成签到,获得积分20
30秒前
科研通AI5应助lgbabe采纳,获得10
48秒前
1分钟前
大雁完成签到 ,获得积分10
1分钟前
lgbabe发布了新的文献求助10
1分钟前
1分钟前
1分钟前
1分钟前
贲孱完成签到,获得积分10
3分钟前
jyy应助科研通管家采纳,获得10
3分钟前
传奇3应助科研通管家采纳,获得10
3分钟前
朴素的山蝶完成签到 ,获得积分10
4分钟前
4分钟前
5分钟前
搜集达人应助科研通管家采纳,获得10
5分钟前
6分钟前
7分钟前
BakerStreet发布了新的文献求助10
7分钟前
科研通AI5应助科研通管家采纳,获得30
7分钟前
8分钟前
英姑应助Czl采纳,获得10
9分钟前
YangSY完成签到,获得积分10
9分钟前
9分钟前
Czl发布了新的文献求助10
9分钟前
稳重班发布了新的文献求助10
10分钟前
科目三应助BakerStreet采纳,获得10
10分钟前
酷波er应助稳重班采纳,获得10
10分钟前
10分钟前
greeeetwist完成签到,获得积分10
10分钟前
木木发布了新的文献求助30
11分钟前
11分钟前
稳重班发布了新的文献求助10
11分钟前
木木完成签到,获得积分10
11分钟前
我是老大应助稳重班采纳,获得30
11分钟前
华仔应助科研通管家采纳,获得10
11分钟前
脑洞疼应助科研通管家采纳,获得10
11分钟前
轻松元绿完成签到 ,获得积分10
11分钟前
高分求助中
新中国出版事业的先驱胡愈之 1500
Essentials of Mental Health 800
Narcissistic Personality Disorder 700
城市流域产汇流机理及其驱动要素研究—以北京市为例 500
Plasmonics 500
Drug distribution in mammals 500
Parametric Random Vibration 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3853922
求助须知:如何正确求助?哪些是违规求助? 3396440
关于积分的说明 10596776
捐赠科研通 3118347
什么是DOI,文献DOI怎么找? 1718568
邀请新用户注册赠送积分活动 827620
科研通“疑难数据库(出版商)”最低求助积分说明 776926