DNA-m6A calling and integrated long-read epigenetic and genetic analysis with fibertools

表观遗传学 计算生物学 DNA测序 生物 DNA DNA甲基化 鉴定(生物学) 遗传学 纳米孔测序 单分子实时测序 DNA测序器 基因 基因表达 植物
作者
Anupama Jha,Stephanie C. Bohaczuk,Yizi Mao,Jane Ranchalis,Benjamin J. Mallory,Alan Min,Morgan O. Hamm,Elliott Swanson,Danilo Dubocanin,Connor Finkbeiner,Tony Li,Dale Whittington,William Stafford Noble,Andrew B. Stergachis,Mitchell R. Vollger
标识
DOI:10.1101/2023.04.20.537673
摘要

Abstract Long-read DNA sequencing has recently emerged as a powerful tool for studying both genetic and epigenetic architectures at single-molecule and single-nucleotide resolution. Long-read epigenetic studies encompass both the direct identification of native cytosine methylation as well as the identification of exogenously placed DNA N 6 -methyladenine (DNA-m6A). However, detecting DNA-m6A modifications using single-molecule sequencing, as well as co-processing single-molecule genetic and epigenetic architectures, is limited by computational demands and a lack of supporting tools. Here, we introduce fibertools , a state-of-the-art toolkit that features a semi-supervised convolutional neural network for fast and accurate identification of m6A-marked bases using PacBio single-molecule long-read sequencing, as well as the co-processing of long-read genetic and epigenetic data produced using either PacBio or Oxford Nanopore sequencing platforms. We demonstrate accurate DNA-m6A identification (>90% precision and recall) along >20 kilobase long DNA molecules with a ∼1,000-fold improvement in speed. In addition, we demonstrate that fibertools can readily integrate genetic and epigenetic data at single-molecule resolution, including the seamless conversion between molecular and reference coordinate systems, allowing for accurate genetic and epigenetic analyses of long-read data within structurally and somatically variable genomic regions.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
77最可爱完成签到,获得积分10
2秒前
3秒前
陶赖赖完成签到,获得积分10
3秒前
dedeyy完成签到,获得积分10
4秒前
拼搏小丸子完成签到 ,获得积分10
7秒前
8秒前
NexusExplorer应助一只盒子采纳,获得10
8秒前
大个应助librahapper采纳,获得10
9秒前
赘婿应助如意的书南采纳,获得10
10秒前
yidingshangan发布了新的文献求助100
12秒前
科研通AI5应助活力的尔蓉采纳,获得10
13秒前
华仔应助逃亡的小狗采纳,获得10
14秒前
16秒前
20秒前
21秒前
一只盒子发布了新的文献求助10
25秒前
27秒前
孔刚完成签到 ,获得积分10
28秒前
李健应助小智多星采纳,获得10
33秒前
清茶韵心发布了新的文献求助10
37秒前
清新的寄风完成签到 ,获得积分10
37秒前
smart完成签到,获得积分10
38秒前
科目三应助活力的尔蓉采纳,获得10
38秒前
LT发布了新的文献求助10
39秒前
39秒前
42秒前
43秒前
半颗糖完成签到 ,获得积分10
44秒前
kai发布了新的文献求助10
46秒前
48秒前
达da完成签到,获得积分10
49秒前
50秒前
陆小果完成签到,获得积分10
52秒前
HL完成签到,获得积分10
53秒前
54秒前
xingxinghan发布了新的文献求助10
56秒前
111完成签到,获得积分20
56秒前
57秒前
1分钟前
搜集达人应助阿邱采纳,获得10
1分钟前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
Maneuvering of a Damaged Navy Combatant 650
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
Mixing the elements of mass customisation 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3778731
求助须知:如何正确求助?哪些是违规求助? 3324256
关于积分的说明 10217657
捐赠科研通 3039405
什么是DOI,文献DOI怎么找? 1668081
邀请新用户注册赠送积分活动 798513
科研通“疑难数据库(出版商)”最低求助积分说明 758401