High-coverage whole-genome sequencing of the expanded 1000 Genomes Project cohort including 602 trios

索引 生物 插补(统计学) 1000基因组计划 基因组 计算生物学 全基因组测序 遗传学 参考基因组 DNA测序 深度测序 全基因组关联研究 单核苷酸多态性 缺少数据 基因 计算机科学 基因型 机器学习
作者
Marta Byrska-Bishop,Uday S. Evani,Xuefang Zhao,Anna O. Basile,Haley Abel,Allison Regier,André Corvelo,Wayne E. Clarke,Rajeeva Musunuri,Kshithija Nagulapalli,Susan Fairley,Alexi Runnels,Lara Winterkorn,Ernesto Lowy,Paul Flicek,Søren Germer,Harrison Brand,Ira M. Hall,Michael E. Talkowski,Giuseppe Narzisi,Michael C. Zody,Evan E. Eichler,Jan O. Korbel,Charles Lee,Tobias Marschall,Scott E. Devine,William T. Harvey,Weichen Zhou,Ryan E. Mills,Tobias Rausch,Sushant Kumar,Can Alkan,Fereydoun Hormozdiari,Zechen Chong,Yu Chen,Xiaofei Yang,Jiadong Lin,Mark Gerstein,Kai Ye,Qihui Zhu,Feyza Yilmaz,Chunlin Xiao
出处
期刊:Cell [Elsevier]
卷期号:185 (18): 3426-3440.e19 被引量:260
标识
DOI:10.1016/j.cell.2022.08.004
摘要

The 1000 Genomes Project (1kGP) is the largest fully open resource of whole-genome sequencing (WGS) data consented for public distribution without access or use restrictions. The final, phase 3 release of the 1kGP included 2,504 unrelated samples from 26 populations and was based primarily on low-coverage WGS. Here, we present a high-coverage 3,202-sample WGS 1kGP resource, which now includes 602 complete trios, sequenced to a depth of 30X using Illumina. We performed single-nucleotide variant (SNV) and short insertion and deletion (INDEL) discovery and generated a comprehensive set of structural variants (SVs) by integrating multiple analytic methods through a machine learning model. We show gains in sensitivity and precision of variant calls compared to phase 3, especially among rare SNVs as well as INDELs and SVs spanning frequency spectrum. We also generated an improved reference imputation panel, making variants discovered here accessible for association studies.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
来了发布了新的文献求助10
1秒前
seabrook发布了新的文献求助10
2秒前
脑洞疼应助michaelzy采纳,获得10
4秒前
Jasper应助aananananan采纳,获得10
4秒前
ss_hHe发布了新的文献求助20
4秒前
5秒前
秋雪瑶应助科研通管家采纳,获得10
6秒前
科研通AI2S应助科研通管家采纳,获得30
6秒前
搜集达人应助科研通管家采纳,获得10
6秒前
6秒前
6秒前
经竺发布了新的文献求助10
6秒前
7秒前
阿大呆呆应助Regu采纳,获得50
7秒前
来了完成签到,获得积分10
8秒前
9秒前
姐姐发布了新的文献求助10
12秒前
vivian完成签到,获得积分10
12秒前
qijia发布了新的文献求助10
13秒前
13秒前
16秒前
Me发布了新的文献求助10
16秒前
17秒前
18秒前
18秒前
Dev2ce发布了新的文献求助10
19秒前
Xxxudi发布了新的文献求助10
19秒前
JamesPei应助跳跃的寄琴采纳,获得10
20秒前
Na完成签到,获得积分10
20秒前
愉快半兰完成签到,获得积分10
21秒前
姐姐完成签到,获得积分20
22秒前
李李给李李的求助进行了留言
23秒前
麻烦~发布了新的文献求助10
23秒前
24秒前
随便完成签到,获得积分10
25秒前
27秒前
shinysparrow应助旺王小小酥采纳,获得10
27秒前
无敌鱼发布了新的文献求助10
28秒前
P1gy完成签到,获得积分10
34秒前
34秒前
高分求助中
Sustainable Land Management: Strategies to Cope with the Marginalisation of Agriculture 1000
Corrosion and Oxygen Control 600
Yaws' Handbook of Antoine coefficients for vapor pressure 500
Python Programming for Linguistics and Digital Humanities: Applications for Text-Focused Fields 500
行動データの計算論モデリング 強化学習モデルを例として 500
Johann Gottlieb Fichte: Die späten wissenschaftlichen Vorlesungen / IV,1: ›Transzendentale Logik I (1812)‹ 400
The role of families in providing long term care to the frail and chronically ill elderly living in the community 380
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2555244
求助须知:如何正确求助?哪些是违规求助? 2179631
关于积分的说明 5620041
捐赠科研通 1900828
什么是DOI,文献DOI怎么找? 949363
版权声明 565579
科研通“疑难数据库(出版商)”最低求助积分说明 504714