Reference-based phasing using the Haplotype Reference Consortium panel

移相器 插补(统计学) 单倍型 计算机科学 参考基因组 1000基因组计划 桑格测序 人口 数据挖掘 计算生物学 生物 遗传学 算法 单核苷酸多态性 基因组 DNA测序 缺少数据 工程类 等位基因 医学 基因型 机器学习 电气工程 基因 环境卫生 DNA
作者
Po‐Ru Loh,Petr Danecek,Pier Francesco Palamara,Christian Fuchsberger,Yakir Reshef,Hilary K. Finucane,Sebastian Schoenherr,Lukas Forer,Shane McCarthy,Gonçalo R. Abecasis,Richard Durbin,Alkes L. Price
标识
DOI:10.1101/052308
摘要

Haplotype phasing is a fundamental problem in medical and population genetics. Phasing is generally performed via statistical phasing within a genotyped cohort, an approach that can attain high accuracy in very large cohorts but attains lower accuracy in smaller cohorts. Here, we instead explore the paradigm of reference-based phasing. We introduce a new phasing algorithm, Eagle2, that attains high accuracy across a broad range of cohort sizes by efficiently leveraging information from large external reference panels (such as the Haplotype Reference Consortium, HRC) using a new data structure based on the positional BurrowsWheeler transform. We demonstrate that Eagle2 attains a ≈20x speedup and ≈10% increase in accuracy compared to reference-based phasing using SHAPEIT2. On European-ancestry samples, Eagle2 with the HRC panel achieves >2x the accuracy of 1000 Genomes-based phasing. Eagle2 is open source and freely available for HRC-based phasing via the Sanger Imputation Service and the Michigan Imputation Server.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
想退休发布了新的文献求助20
1秒前
orixero应助能干发夹采纳,获得10
2秒前
坚定的雁完成签到 ,获得积分10
2秒前
毕业发布了新的文献求助10
3秒前
Ava应助风清扬采纳,获得10
4秒前
5秒前
whoknowsname完成签到,获得积分10
5秒前
文耳东发布了新的文献求助10
6秒前
学霸业完成签到,获得积分10
6秒前
liu完成签到,获得积分10
6秒前
DrBobby关注了科研通微信公众号
7秒前
Cenhuan完成签到,获得积分20
8秒前
bee完成签到 ,获得积分10
8秒前
8秒前
pizza完成签到,获得积分10
9秒前
niudayun发布了新的文献求助30
9秒前
互助应助daifei采纳,获得50
9秒前
一盆小鱼完成签到 ,获得积分10
10秒前
liu发布了新的文献求助30
10秒前
10秒前
11秒前
追风少年发布了新的文献求助10
11秒前
SinnyMou完成签到,获得积分10
11秒前
欢子关注了科研通微信公众号
11秒前
海阔云高完成签到,获得积分10
12秒前
14秒前
14秒前
14秒前
英吉利25发布了新的文献求助10
15秒前
小马甲应助不语采纳,获得10
15秒前
海阔云高发布了新的文献求助10
15秒前
七七发布了新的文献求助10
16秒前
LZR完成签到,获得积分0
16秒前
jj发布了新的文献求助10
16秒前
粥粥完成签到,获得积分10
17秒前
penghui完成签到,获得积分10
17秒前
17秒前
18秒前
Cenhuan关注了科研通微信公众号
19秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Salmon nasal cartilage-derived proteoglycan complexes influence the gut microbiota and bacterial metabolites in mice 2000
The Composition and Relative Chronology of Dynasties 16 and 17 in Egypt 1500
Cowries - A Guide to the Gastropod Family Cypraeidae 1200
Hemispherical Resonator Gyro: Status Report and Test Results 800
ON THE THEORY OF BIRATIONAL BLOWING-UP 666
Signals, Systems, and Signal Processing 610
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6382320
求助须知:如何正确求助?哪些是违规求助? 8194537
关于积分的说明 17323350
捐赠科研通 5435937
什么是DOI,文献DOI怎么找? 2875142
邀请新用户注册赠送积分活动 1851812
关于科研通互助平台的介绍 1696405