清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Disease variant prediction with deep generative models of evolutionary data

计算机科学 生成语法 人工智能 致病性 生成模型 计算模型 机器学习 计算生物学 生物 微生物学
作者
Jonathan Frazer,Pascal Notin,Mafalda Dias,Aidan N. Gomez,Joseph Min,Kelly P. Brock,Yarin Gal,Debora S. Marks
出处
期刊:Nature [Nature Portfolio]
卷期号:599 (7883): 91-95 被引量:512
标识
DOI:10.1038/s41586-021-04043-8
摘要

Quantifying the pathogenicity of protein variants in human disease-related genes would have a marked effect on clinical decisions, yet the overwhelming majority (over 98%) of these variants still have unknown consequences1–3. In principle, computational methods could support the large-scale interpretation of genetic variants. However, state-of-the-art methods4–10 have relied on training machine learning models on known disease labels. As these labels are sparse, biased and of variable quality, the resulting models have been considered insufficiently reliable11. Here we propose an approach that leverages deep generative models to predict variant pathogenicity without relying on labels. By modelling the distribution of sequence variation across organisms, we implicitly capture constraints on the protein sequences that maintain fitness. Our model EVE (evolutionary model of variant effect) not only outperforms computational approaches that rely on labelled data but also performs on par with, if not better than, predictions from high-throughput experiments, which are increasingly used as evidence for variant classification12–16. We predict the pathogenicity of more than 36 million variants across 3,219 disease genes and provide evidence for the classification of more than 256,000 variants of unknown significance. Our work suggests that models of evolutionary information can provide valuable independent evidence for variant interpretation that will be widely useful in research and clinical settings. A new computational method, EVE, classifies human genetic variants in disease genes using deep generative models trained solely on evolutionary sequences.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
水哥完成签到 ,获得积分10
17秒前
勤奋的灯完成签到 ,获得积分10
36秒前
Party完成签到 ,获得积分10
50秒前
卓矢完成签到 ,获得积分10
2分钟前
方白秋完成签到,获得积分10
2分钟前
Sunny完成签到,获得积分10
3分钟前
3分钟前
noss发布了新的文献求助10
3分钟前
3分钟前
3分钟前
3分钟前
3分钟前
3分钟前
袁青寒发布了新的文献求助10
3分钟前
袁青寒发布了新的文献求助10
3分钟前
袁青寒发布了新的文献求助10
3分钟前
袁青寒发布了新的文献求助10
3分钟前
袁青寒发布了新的文献求助10
3分钟前
稻子完成签到 ,获得积分10
3分钟前
3分钟前
科研通AI2S应助科研通管家采纳,获得10
3分钟前
科研通AI2S应助科研通管家采纳,获得10
3分钟前
共享精神应助袁青寒采纳,获得10
4分钟前
852应助袁青寒采纳,获得10
4分钟前
凯文完成签到 ,获得积分10
4分钟前
5分钟前
woxinyouyou完成签到,获得积分0
6分钟前
lingling完成签到 ,获得积分10
7分钟前
HiNDT发布了新的文献求助10
7分钟前
Jemma完成签到 ,获得积分10
7分钟前
润润轩轩完成签到 ,获得积分10
8分钟前
firewood完成签到 ,获得积分10
9分钟前
科研通AI2S应助ceeray23采纳,获得30
9分钟前
llhh2024完成签到,获得积分10
9分钟前
lee完成签到 ,获得积分10
10分钟前
Eri_SCI完成签到 ,获得积分10
10分钟前
肉肉完成签到 ,获得积分10
11分钟前
跨越山海的热爱完成签到 ,获得积分10
11分钟前
Milesgao完成签到,获得积分10
12分钟前
wushuimei完成签到 ,获得积分10
12分钟前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
ISCN 2024 – An International System for Human Cytogenomic Nomenclature (2024) 3000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
T/CAB 0344-2024 重组人源化胶原蛋白内毒素去除方法 1000
Maneuvering of a Damaged Navy Combatant 650
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3776014
求助须知:如何正确求助?哪些是违规求助? 3321534
关于积分的说明 10206222
捐赠科研通 3036609
什么是DOI,文献DOI怎么找? 1666373
邀请新用户注册赠送积分活动 797395
科研通“疑难数据库(出版商)”最低求助积分说明 757805