Learning protein fitness landscapes with deep mutational scanning data from multiple sources

外推法 机器学习 适应度函数 健身景观 随机森林 计算机科学 人工智能 数学 遗传算法 人口 数学分析 人口学 社会学
作者
Lin Chen,Zehong Zhang,Zhenghao Li,Rui Li,Ruifeng Huo,Lifan Chen,Dingyan Wang,Xiaomin Luo,Kaixian Chen,Cangsong Liao,Mingyue Zheng
出处
期刊:Cell systems [Elsevier]
卷期号:14 (8): 706-721.e5 被引量:2
标识
DOI:10.1016/j.cels.2023.07.003
摘要

One of the key points of machine learning-assisted directed evolution (MLDE) is the accurate learning of the fitness landscape, a conceptual mapping from sequence variants to the desired function. Here, we describe a multi-protein training scheme that leverages the existing deep mutational scanning data from diverse proteins to aid in understanding the fitness landscape of a new protein. Proof-of-concept trials are designed to validate this training scheme in three aspects: random and positional extrapolation for single-variant effects, zero-shot fitness predictions for new proteins, and extrapolation for higher-order variant effects from single-variant effects. Moreover, our study identified previously overlooked strong baselines, and their unexpectedly good performance brings our attention to the pitfalls of MLDE. Overall, these results may improve our understanding of the association between different protein fitness profiles and shed light on developing better machine learning-assisted approaches to the directed evolution of proteins. A record of this paper's transparent peer review process is included in the supplemental information.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
呆萌的鼠标完成签到 ,获得积分10
1秒前
luotuotuo完成签到,获得积分20
2秒前
Lyue完成签到,获得积分10
3秒前
爆米花应助Tonald Yang采纳,获得10
6秒前
7秒前
乐乐应助刘宁采纳,获得10
9秒前
123完成签到 ,获得积分10
10秒前
centlay发布了新的文献求助10
14秒前
Lyn完成签到 ,获得积分10
18秒前
多克特里完成签到 ,获得积分10
21秒前
21秒前
22秒前
搜集达人应助研友_LpvQlZ采纳,获得200
22秒前
David完成签到 ,获得积分10
27秒前
刘宁发布了新的文献求助10
28秒前
28秒前
研友_Z119gZ完成签到 ,获得积分10
28秒前
huangqian完成签到,获得积分10
29秒前
唠叨的傲薇完成签到 ,获得积分10
31秒前
乐观的怀梦完成签到 ,获得积分10
35秒前
阿斯顿完成签到,获得积分10
38秒前
后浪完成签到 ,获得积分10
38秒前
39秒前
Vivian完成签到 ,获得积分10
39秒前
研友_ZGmVjL完成签到 ,获得积分10
50秒前
迷人的沛山完成签到,获得积分10
52秒前
虚幻花卷完成签到,获得积分10
54秒前
小宣完成签到,获得积分10
1分钟前
fufu完成签到 ,获得积分10
1分钟前
西兰花的科研小助手完成签到,获得积分10
1分钟前
温馨完成签到 ,获得积分10
1分钟前
小白完成签到 ,获得积分10
1分钟前
小白完成签到 ,获得积分10
1分钟前
大方的忆灵完成签到 ,获得积分10
1分钟前
滕皓轩完成签到 ,获得积分10
1分钟前
勤劳钧完成签到,获得积分10
1分钟前
包容菲鹰完成签到 ,获得积分10
1分钟前
keplek完成签到 ,获得积分10
1分钟前
上官若男应助科研通管家采纳,获得10
1分钟前
轩辕寄风应助科研通管家采纳,获得10
1分钟前
高分求助中
Formgebungs- und Stabilisierungsparameter für das Konstruktionsverfahren der FiDU-Freien Innendruckumformung von Blech 1000
The Illustrated History of Gymnastics 800
The Bourse of Babylon : market quotations in the astronomical diaries of Babylonia 680
Division and square root. Digit-recurrence algorithms and implementations 500
The role of a multidrug-resistance gene (lemdrl) in conferring vinblastine resistance in Leishmania enriettii 330
Elgar Encyclopedia of Consumer Behavior 300
機能營養學前瞻(3 Ed.) 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2510222
求助须知:如何正确求助?哪些是违规求助? 2159881
关于积分的说明 5529972
捐赠科研通 1880131
什么是DOI,文献DOI怎么找? 935655
版权声明 564215
科研通“疑难数据库(出版商)”最低求助积分说明 499559