亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Iterative improvement of deep learning models using synthetic regulatory genomics

生物 计算生物学 基因组学 深度学习 功能基因组学 基因组 人工智能 机器学习 遗传学 计算机科学 基因
作者
André M. Ribeiro-dos-Santos,Matthew T. Maurano
出处
期刊:Genome Research [Cold Spring Harbor Laboratory]
标识
DOI:10.1101/gr.280540.125
摘要

Deep learning models can accurately reconstruct genome-wide epigenetic tracks from the reference genome sequence alone. But it is unclear what predictive power they have on sequence diverging from the reference, such as disease- and trait-associated variants or engineered sequences. Recent work has applied synthetic regulatory genomics to characterized dozens of deletions, inversions, and rearrangements of DNase I hypersensitive sites (DHSs). Here, we use the state-of-the-art model Enformer to predict DNA accessibility and RNA transcription across these engineered sequences when delivered at their endogenous loci. At a high level, we observe a good correlation between accessibility predicted by Enformer and experimental data. But model performance is best for sequences that more resembled the reference, such as single deletions or combinations of multiple DHSs. Predictive power is poorer for rearrangements affecting DHS order or orientation. We use these data to fine-tune Enformer, yielding significant reduction in prediction error. We show that this fine-tuning retains strong predictive performance for other tracks. Our results show that current deep learning models perform poorly when presented with novel sequences diverging in certain critical features from their training set. Thus, an iterative approach incorporating profiling of synthetic constructs can improve model generalizability and ultimately enable functional classification of regulatory variants identified by population studies.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
2秒前
5秒前
Criminology34应助科研通管家采纳,获得10
5秒前
Criminology34应助科研通管家采纳,获得10
5秒前
Criminology34应助科研通管家采纳,获得10
5秒前
Criminology34应助科研通管家采纳,获得10
5秒前
Criminology34应助科研通管家采纳,获得10
5秒前
Criminology34应助科研通管家采纳,获得10
5秒前
Criminology34应助科研通管家采纳,获得10
5秒前
科研通AI2S应助科研通管家采纳,获得10
5秒前
gty发布了新的文献求助10
5秒前
JEK发布了新的文献求助10
6秒前
6秒前
7秒前
暗号完成签到 ,获得积分0
9秒前
OrangeWang发布了新的文献求助10
11秒前
Hello应助羞涩的菲鹰采纳,获得10
24秒前
30秒前
30秒前
代号K完成签到,获得积分10
32秒前
37秒前
ZIJUNZHAO完成签到 ,获得积分10
38秒前
小二郎应助蛙蛙采纳,获得100
41秒前
42秒前
44秒前
48秒前
可靠的雁菱完成签到,获得积分10
48秒前
48秒前
49秒前
独特的不尤完成签到,获得积分10
49秒前
从容未来完成签到,获得积分10
53秒前
蛙蛙发布了新的文献求助100
55秒前
蛙蛙完成签到,获得积分10
1分钟前
绿柏完成签到,获得积分10
1分钟前
Hello应助Nature_Science采纳,获得10
1分钟前
轻松大王完成签到,获得积分10
1分钟前
1分钟前
万能图书馆应助甜蜜乐松采纳,获得10
1分钟前
苏新天完成签到 ,获得积分10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
人脑智能与人工智能 1000
理系総合のための生命科学 第5版〜分子・細胞・個体から知る“生命"のしくみ 800
普遍生物学: 物理に宿る生命、生命の紡ぐ物理 800
花の香りの秘密―遺伝子情報から機能性まで 800
King Tyrant 720
Silicon in Organic, Organometallic, and Polymer Chemistry 500
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5606552
求助须知:如何正确求助?哪些是违规求助? 4690976
关于积分的说明 14866654
捐赠科研通 4706811
什么是DOI,文献DOI怎么找? 2542800
邀请新用户注册赠送积分活动 1508189
关于科研通互助平台的介绍 1472276