Haplotype-aware variant calling with PEPPER-Margin-DeepVariant enables high accuracy in nanopore long-reads

纳米孔 管道(软件) 计算机科学 基因组 纳米孔测序 边距(机器学习) 顺序装配 单倍型 参考基因组 基因分型 生物 计算生物学 基因 遗传学 纳米技术 材料科学 机器学习 转录组 基因型 基因表达 程序设计语言
作者
Kishwar Shafin,Trevor Pesout,Pi-Chuan Chang,Maria Nattestad,Alexey Kolesnikov,Sidharth Goel,Gunjan Baid,Mikhail Kolmogorov,Jordan M. Eizenga,Karen H. Miga,P. Carnevali,Miten Jain,Andrew Carroll,Benedict Paten
出处
期刊:Nature Methods [Nature Portfolio]
卷期号:18 (11): 1322-1332 被引量:217
标识
DOI:10.1038/s41592-021-01299-w
摘要

Long-read sequencing has the potential to transform variant detection by reaching currently difficult-to-map regions and routinely linking together adjacent variations to enable read-based phasing. Third-generation nanopore sequence data have demonstrated a long read length, but current interpretation methods for their novel pore-based signal have unique error profiles, making accurate analysis challenging. Here, we introduce a haplotype-aware variant calling pipeline, PEPPER-Margin-DeepVariant, that produces state-of-the-art variant calling results with nanopore data. We show that our nanopore-based method outperforms the short-read-based single-nucleotide-variant identification method at the whole-genome scale and produces high-quality single-nucleotide variants in segmental duplications and low-mappability regions where short-read-based genotyping fails. We show that our pipeline can provide highly contiguous phase blocks across the genome with nanopore reads, contiguously spanning between 85% and 92% of annotated genes across six samples. We also extend PEPPER-Margin-DeepVariant to PacBio HiFi data, providing an efficient solution with superior performance over the current WhatsHap-DeepVariant standard. Finally, we demonstrate de novo assembly polishing methods that use nanopore and PacBio HiFi reads to produce diploid assemblies with high accuracy (Q35+ nanopore-polished and Q40+ PacBio HiFi-polished).
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
阿布与小佛完成签到 ,获得积分10
1秒前
4秒前
ezekiet完成签到 ,获得积分10
4秒前
ww完成签到,获得积分10
5秒前
拼搏的青雪完成签到 ,获得积分10
6秒前
lllll完成签到,获得积分10
9秒前
海林完成签到 ,获得积分10
9秒前
科研通AI2S应助科研通管家采纳,获得10
11秒前
H恺完成签到,获得积分10
11秒前
天天快乐应助科研通管家采纳,获得10
11秒前
KJ应助科研通管家采纳,获得10
11秒前
water应助科研通管家采纳,获得10
11秒前
orixero应助科研通管家采纳,获得10
11秒前
酷酷傲珊应助科研通管家采纳,获得10
12秒前
Freelover应助科研通管家采纳,获得10
12秒前
KJ应助科研通管家采纳,获得10
12秒前
wanci应助科研通管家采纳,获得10
12秒前
water应助科研通管家采纳,获得10
12秒前
12秒前
123完成签到,获得积分10
14秒前
22秒前
24秒前
xcuwlj完成签到 ,获得积分10
24秒前
XXXX完成签到,获得积分10
24秒前
笛九完成签到 ,获得积分10
25秒前
文与武完成签到 ,获得积分10
26秒前
Hermon发布了新的文献求助10
27秒前
星空完成签到 ,获得积分10
27秒前
拾忆完成签到,获得积分10
27秒前
领导范儿应助滴滴采纳,获得10
28秒前
S1mple_gentleman完成签到,获得积分10
30秒前
东北饿霸完成签到,获得积分0
32秒前
乱世才子完成签到,获得积分10
33秒前
35秒前
36秒前
38秒前
UUU完成签到 ,获得积分10
39秒前
胡杨树2006完成签到,获得积分10
39秒前
3210592完成签到 ,获得积分10
39秒前
畅快山兰完成签到 ,获得积分10
42秒前
高分求助中
(应助此贴封号)【重要!!请各位详细阅读】【科研通的精品贴汇总】 10000
F-35B V2.0 How to build Kitty Hawk's F-35B Version 2.0 Model 2000
中国兽药产业发展报告 1000
Biodegradable Embolic Microspheres Market Insights 888
Quantum reference frames : from quantum information to spacetime 888
Pediatric Injectable Drugs 500
2025-2031全球及中国蛋黄lgY抗体行业研究及十五五规划分析报告(2025-2031 Global and China Chicken lgY Antibody Industry Research and 15th Five Year Plan Analysis Report) 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4445600
求助须知:如何正确求助?哪些是违规求助? 3915687
关于积分的说明 12156180
捐赠科研通 3564814
什么是DOI,文献DOI怎么找? 1957245
邀请新用户注册赠送积分活动 996856
科研通“疑难数据库(出版商)”最低求助积分说明 892126