Efficient and Scalable Alignment-Free Distributed Genotyping of SNPs and Short Indels

索引 基因分型 单核苷酸多态性 计算生物学 可扩展性 计算机科学 SNP基因分型 遗传学 生物 基因型 基因 数据库
作者
Lorenzo Di Rocco,Umberto Ferraro Petrillo
标识
DOI:10.1109/tcbbio.2025.3525547
摘要

The growing volume of sequencing data and the ever-larger size of variants databases challenge genotyping procedures to handle massive genomics datasets efficiently. Recent alignment-free solutions leverage exclusively on the k-mers counts to speed up the analysis, but have to trade off the time gain against the memory requirements, to make the elaborations possible on a single workstation. In this paper, we present SparkGeno+, a novel alignment-free (AF) distributed pipeline for the fast and accurate genotyping of Single Nucleotide Polymorphisms (SNPs) and indels on a large scale. Starting from a previous pipeline, we identified and evaluated the performance bottlenecks that arise when performing genotyping using a standard AF approach, to develop and implement several innovations to better exploit the resources of a distributed system. The effectiveness of our proposal has been validated through an experimental analysis on widely studied datasets. The results show that the accuracy of SparkGeno+ matches the one of state-of-the-art alignment-free tools like Vargeno and MALVA. Moreover, the time performance of SparkGeno+ scales well with the number of computing units, thus allowing execution times that are in order of growth smaller than those of classical genotyping tools. This indicates SparkGeno+ to be a promising solution for large-scale genotyping applications.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
Hey发布了新的文献求助10
刚刚
yuyu发布了新的文献求助10
刚刚
song发布了新的文献求助10
1秒前
1秒前
李爱国应助白忘幽采纳,获得10
2秒前
Om完成签到,获得积分10
2秒前
量子星尘发布了新的文献求助10
2秒前
2秒前
111完成签到 ,获得积分10
2秒前
爱笑丹云应助杨树林采纳,获得10
2秒前
梦会故乡发布了新的文献求助30
3秒前
4秒前
5秒前
6秒前
万能图书馆应助zzz采纳,获得10
6秒前
乐乐应助Ines采纳,获得10
6秒前
小c应助Alma采纳,获得10
8秒前
8秒前
往往小陈发布了新的文献求助60
8秒前
MarsDreamer发布了新的文献求助10
8秒前
10秒前
11秒前
hhh发布了新的文献求助10
11秒前
背后信封完成签到 ,获得积分10
12秒前
科研小白发布了新的文献求助10
13秒前
susu发布了新的文献求助10
13秒前
科研通AI6.3应助于泽采纳,获得10
13秒前
16秒前
个性向秋发布了新的文献求助20
16秒前
18秒前
甜甜的难敌完成签到,获得积分10
18秒前
HUYAOWEI发布了新的文献求助10
18秒前
18秒前
荔枝一点_完成签到,获得积分10
18秒前
hellojwx发布了新的文献求助20
19秒前
20秒前
大力的灵雁应助黄智清采纳,获得10
20秒前
21秒前
21秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Burger's Medicinal Chemistry, Drug Discovery and Development, Volumes 1 - 8, 8 Volume Set, 8th Edition 1800
Cronologia da história de Macau 1600
Contemporary Debates in Epistemology (3rd Edition) 1000
International Arbitration Law and Practice 1000
文献PREDICTION EQUATIONS FOR SHIPS' TURNING CIRCLES或期刊Transactions of the North East Coast Institution of Engineers and Shipbuilders第95卷 1000
BRITTLE FRACTURE IN WELDED SHIPS 1000
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 纳米技术 计算机科学 化学工程 生物化学 物理 复合材料 内科学 催化作用 物理化学 光电子学 细胞生物学 基因 电极 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6156774
求助须知:如何正确求助?哪些是违规求助? 7985116
关于积分的说明 16594535
捐赠科研通 5266620
什么是DOI,文献DOI怎么找? 2810148
邀请新用户注册赠送积分活动 1790521
关于科研通互助平台的介绍 1657672