A predictive language model for SARS-CoV-2 evolution

随机性 突变 计算生物学 计算机科学 生物 严重急性呼吸综合征冠状病毒2型(SARS-CoV-2) 2019年冠状病毒病(COVID-19) 遗传学 医学 数学 基因 统计 传染病(医学专业) 疾病 病理
作者
Enhao Ma,Xuan Guo,Mingda Hu,Penghua Wang,Xin Wang,Congwen Wei,Gong Cheng
出处
期刊:Signal Transduction and Targeted Therapy [Springer Nature]
卷期号:9 (1)
标识
DOI:10.1038/s41392-024-02066-x
摘要

Abstract Modeling and predicting mutations are critical for COVID-19 and similar pandemic preparedness. However, existing predictive models have yet to integrate the regularity and randomness of viral mutations with minimal data requirements. Here, we develop a non-demanding language model utilizing both regularity and randomness to predict candidate SARS-CoV-2 variants and mutations that might prevail. We constructed the “grammatical frameworks” of the available S1 sequences for dimension reduction and semantic representation to grasp the model’s latent regularity. The mutational profile, defined as the frequency of mutations, was introduced into the model to incorporate randomness. With this model, we successfully identified and validated several variants with significantly enhanced viral infectivity and immune evasion by wet-lab experiments. By inputting the sequence data from three different time points, we detected circulating strains or vital mutations for XBB.1.16, EG.5, JN.1, and BA.2.86 strains before their emergence. In addition, our results also predicted the previously unknown variants that may cause future epidemics. With both the data validation and experiment evidence, our study represents a fast-responding, concise, and promising language model, potentially generalizable to other viral pathogens, to forecast viral evolution and detect crucial hot mutation spots, thus warning the emerging variants that might raise public health concern.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
NNUsusan发布了新的文献求助20
刚刚
ding应助alan采纳,获得10
刚刚
饱满秋白发布了新的文献求助10
刚刚
刚刚
李健的小迷弟应助mtt采纳,获得10
1秒前
平常的逍遥完成签到,获得积分10
1秒前
鳗鱼友灵发布了新的文献求助10
2秒前
2秒前
preeee发布了新的文献求助10
2秒前
2秒前
3秒前
酷炫甜瓜完成签到,获得积分10
3秒前
完美世界应助答题不卡采纳,获得20
3秒前
4秒前
5秒前
5秒前
6秒前
7秒前
7秒前
赵世璧发布了新的文献求助10
7秒前
科研通AI6应助念梦采纳,获得10
8秒前
张777粒粒发布了新的文献求助30
9秒前
nanjiab发布了新的文献求助10
9秒前
10秒前
lulu发布了新的文献求助10
10秒前
tianle发布了新的文献求助10
11秒前
11秒前
DongYiFan完成签到 ,获得积分10
11秒前
Hilda007发布了新的文献求助100
11秒前
李秋秋发布了新的文献求助10
12秒前
12秒前
peace发布了新的文献求助30
12秒前
寒水完成签到 ,获得积分10
12秒前
12秒前
单纯无声完成签到,获得积分20
13秒前
榴莲麦旋风完成签到,获得积分10
13秒前
共享精神应助Esther采纳,获得10
14秒前
蛋蛋完成签到,获得积分10
14秒前
Foch发布了新的文献求助10
16秒前
16秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
List of 1,091 Public Pension Profiles by Region 1581
以液相層析串聯質譜法分析糖漿產品中活性雙羰基化合物 / 吳瑋元[撰] = Analysis of reactive dicarbonyl species in syrup products by LC-MS/MS / Wei-Yuan Wu 1000
Biology of the Reptilia. Volume 21. Morphology I. The Skull and Appendicular Locomotor Apparatus of Lepidosauria 600
The Scope of Slavic Aspect 600
Foregrounding Marking Shift in Sundanese Written Narrative Segments 600
Rousseau, le chemin de ronde 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5540818
求助须知:如何正确求助?哪些是违规求助? 4627343
关于积分的说明 14603974
捐赠科研通 4568485
什么是DOI,文献DOI怎么找? 2504563
邀请新用户注册赠送积分活动 1482157
关于科研通互助平台的介绍 1453707