FLASH: fast length adjustment of short reads to improve genome assemblies

计算机科学 康蒂格 闪光灯(摄影) 基因组 软件 顺序装配 k-mer公司 杂交基因组组装 正确性 计算生物学 算法 生物 遗传学 操作系统 基因 艺术 基因表达 视觉艺术 转录组
作者
Tanja Magoč,Steven L. Salzberg
出处
期刊:Bioinformatics [Oxford University Press]
卷期号:27 (21): 2957-2963 被引量:15095
标识
DOI:10.1093/bioinformatics/btr507
摘要

Abstract Motivation: Next-generation sequencing technologies generate very large numbers of short reads. Even with very deep genome coverage, short read lengths cause problems in de novo assemblies. The use of paired-end libraries with a fragment size shorter than twice the read length provides an opportunity to generate much longer reads by overlapping and merging read pairs before assembling a genome. Results: We present FLASH, a fast computational tool to extend the length of short reads by overlapping paired-end reads from fragment libraries that are sufficiently short. We tested the correctness of the tool on one million simulated read pairs, and we then applied it as a pre-processor for genome assemblies of Illumina reads from the bacterium Staphylococcus aureus and human chromosome 14. FLASH correctly extended and merged reads >99% of the time on simulated reads with an error rate of <1%. With adequately set parameters, FLASH correctly merged reads over 90% of the time even when the reads contained up to 5% errors. When FLASH was used to extend reads prior to assembly, the resulting assemblies had substantially greater N50 lengths for both contigs and scaffolds. Availability and Implementation: The FLASH system is implemented in C and is freely available as open-source code at http://www.cbcb.umd.edu/software/flash. Contact: t.magoc@gmail.com
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
勤劳斑马发布了新的文献求助20
1秒前
水玉耳朵完成签到,获得积分10
1秒前
goblue完成签到,获得积分10
2秒前
复杂的果汁完成签到,获得积分20
2秒前
淡然语芙发布了新的文献求助10
2秒前
2秒前
2秒前
3秒前
3秒前
3秒前
3秒前
4秒前
4秒前
5秒前
风趣妙柏完成签到,获得积分10
6秒前
典雅碧空发布了新的文献求助10
6秒前
小宅宅完成签到,获得积分10
6秒前
xxszyb发布了新的文献求助10
6秒前
7秒前
pearlwh1227发布了新的文献求助10
7秒前
7秒前
7秒前
哇哇哇发布了新的文献求助10
7秒前
7秒前
30040完成签到,获得积分10
8秒前
笨笨水儿完成签到 ,获得积分10
9秒前
打打应助成就的安阳采纳,获得10
9秒前
FashionBoy应助LLL采纳,获得10
9秒前
1111发布了新的文献求助10
9秒前
打打应助SZU_Julian采纳,获得10
9秒前
9秒前
粗心的羽毛应助Corundum采纳,获得20
10秒前
grgrr发布了新的文献求助10
10秒前
年年有余发布了新的文献求助10
10秒前
雾绕发布了新的文献求助10
10秒前
viyo发布了新的文献求助10
11秒前
12秒前
学术小垃圾完成签到,获得积分10
12秒前
拙劣的马奎完成签到,获得积分10
12秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Organometallic Chemistry of the Transition Metals 800
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
The formation of Australian attitudes towards China, 1918-1941 640
Signals, Systems, and Signal Processing 610
全相对论原子结构与含时波包动力学的理论研究--清华大学 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6442801
求助须知:如何正确求助?哪些是违规求助? 8256725
关于积分的说明 17583456
捐赠科研通 5501406
什么是DOI,文献DOI怎么找? 2900701
邀请新用户注册赠送积分活动 1877632
关于科研通互助平台的介绍 1717354