已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Genome modeling and design across all domains of life with Evo 2

进化生物学 计算生物学 生物
作者
Garyk Brixi,Matthew G. Durrant,Ja‐Lok Ku,Michael Poli,Greg Brockman,Daniel Chang,Gabriel González,S. B. King,David Li,S. B. King,Mohsen Naghipourfar,Eric Nguyen,Chiara Ricci-Tam,David W. Romero,Gwanggyu Sun,Ali Taghibakshi,A. A. Vorontsov,B. S. Yang,Mengjiao Deng,Liv Gorton
标识
DOI:10.1101/2025.02.18.638918
摘要

Abstract All of life encodes information with DNA. While tools for sequencing, synthesis, and editing of genomic code have transformed biological research, intelligently composing new biological systems would also require a deep understanding of the immense complexity encoded by genomes. We introduce Evo 2, a biological foundation model trained on 9.3 trillion DNA base pairs from a highly curated genomic atlas spanning all domains of life. We train Evo 2 with 7B and 40B parameters to have an unprecedented 1 million token context window with single-nucleotide resolution. Evo 2 learns from DNA sequence alone to accurately predict the functional impacts of genetic variation—from noncoding pathogenic mutations to clinically significant BRCA1 variants—without task-specific finetuning. Applying mechanistic interpretability analyses, we reveal that Evo 2 autonomously learns a breadth of biological features, including exon–intron boundaries, transcription factor binding sites, protein structural elements, and prophage genomic regions. Beyond its predictive capabilities, Evo 2 generates mitochondrial, prokaryotic, and eukaryotic sequences at genome scale with greater naturalness and coherence than previous methods. Guiding Evo 2 via inference-time search enables controllable generation of epigenomic structure, for which we demonstrate the first inference-time scaling results in biology. We make Evo 2 fully open, including model parameters, training code, inference code, and the OpenGenome2 dataset, to accelerate the exploration and design of biological complexity.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
123发布了新的文献求助20
1秒前
L同学发布了新的文献求助10
3秒前
6秒前
8秒前
asdzsx发布了新的文献求助10
10秒前
HJJHJH发布了新的文献求助10
11秒前
小巧健柏完成签到,获得积分10
12秒前
微凉完成签到 ,获得积分10
12秒前
justinshi完成签到,获得积分10
13秒前
14秒前
zz发布了新的文献求助10
17秒前
烟花应助美好斓采纳,获得10
23秒前
JamesPei应助L同学采纳,获得10
23秒前
25秒前
26秒前
xxfsx应助堃堃boom采纳,获得10
29秒前
隐形曼青应助yooga采纳,获得30
29秒前
30秒前
30秒前
无言克己完成签到,获得积分10
31秒前
31秒前
zhaoqing完成签到,获得积分10
31秒前
justinshi发布了新的文献求助30
32秒前
34秒前
Snape完成签到,获得积分10
34秒前
美好斓发布了新的文献求助10
37秒前
zz完成签到,获得积分10
40秒前
Evan完成签到 ,获得积分10
41秒前
41秒前
去月球数星星完成签到,获得积分10
43秒前
pgojpogk完成签到,获得积分10
45秒前
123完成签到,获得积分10
45秒前
零知识发布了新的文献求助30
45秒前
可爱的函函应助Kaka采纳,获得10
46秒前
47秒前
47秒前
领导范儿应助guo89采纳,获得10
48秒前
小蘑菇应助无言克己采纳,获得10
48秒前
李昀睿完成签到,获得积分20
49秒前
小猪完成签到,获得积分10
50秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Introduction to Early Childhood Education 1000
List of 1,091 Public Pension Profiles by Region 921
Aerospace Standards Index - 2025 800
Identifying dimensions of interest to support learning in disengaged students: the MINE project 800
流动的新传统主义与新生代农民工的劳动力再生产模式变迁 500
Historical Dictionary of British Intelligence (2014 / 2nd EDITION!) 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5431921
求助须知:如何正确求助?哪些是违规求助? 4544722
关于积分的说明 14193735
捐赠科研通 4463977
什么是DOI,文献DOI怎么找? 2446906
邀请新用户注册赠送积分活动 1438241
关于科研通互助平台的介绍 1414998