已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

scSparkXMBD: High-Performance scRNA-seq Data Processing with Spark

可扩展性 SPARK(编程语言) 管道(软件) 计算机科学 管道运输 数据处理 瓶颈 大数据 条形码 数据挖掘 数据库 操作系统 嵌入式系统 工程类 程序设计语言 环境工程
作者
Yu Liu,Mingxuan Gao,Lixuan Tan,Hongjin Liu,Yating Lin,Wenxian Yang,Rongshan Yu
标识
DOI:10.1109/bibm52615.2021.9669512
摘要

High-throughput single-cell RNA sequencing (scRNA-seq) data processing pipelines integrate multiple modules to transform raw scRNA-seq data to gene expression matrices, including barcode processing, sequence quality control, genome alignment and transcript quantification. With the rapid growth in data volume, the speed of scRNA-seq data processing pipeline has become a major bottleneck to large-scale scRNA-seq studies. We present scSpark XMBD 1 (denoted as scSpark), a cloud computing based scRNA-seq data processing pipeline. By leveraging the in-memory computing capability of Apache Spark, scSpark significantly improves the processing speed of scRNA-seq data, and achieves around 5-20 times faster than the state-of-the-art processing pipelines under the same CPU core consumption. In addition, thanks to the inherent scalability of Spark in a cloud computing environment, scSpark can further reduce the processing time for a typical scRNA-seq dataset (e.g., 640 million reads) from hours to minutes when multiple computer nodes (e.g., 16) are used. Biological evaluation also confirmed that the results generated by scSpark are highly consistent with existing scRNA-seq data processing pipelines. 1 XMBD refers to Xiamen Big Data, which is a biomedical open software initiative in the National Institute for Data Science in Health and Medicine, Xiamen University, China
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
英俊的铭应助kskdss采纳,获得10
4秒前
AXLL完成签到 ,获得积分10
4秒前
zhangfan发布了新的文献求助10
5秒前
11秒前
zhangfan完成签到,获得积分10
12秒前
胡图图啦啦完成签到 ,获得积分10
14秒前
Winnie哈哈哈哈哈完成签到,获得积分10
14秒前
HoHo完成签到 ,获得积分10
15秒前
凤里完成签到 ,获得积分10
16秒前
刻苦小鸭子完成签到,获得积分10
17秒前
苗条的小蜜蜂完成签到 ,获得积分10
20秒前
悦耳的绿海完成签到 ,获得积分10
21秒前
28秒前
开放诗完成签到 ,获得积分10
30秒前
Hello应助怡然的飞珍采纳,获得10
31秒前
繁荣的心情完成签到,获得积分10
33秒前
干净绿真发布了新的文献求助10
33秒前
慕容雅柏完成签到 ,获得积分10
33秒前
ANmin完成签到 ,获得积分10
37秒前
38秒前
沈菁菁完成签到 ,获得积分10
40秒前
40秒前
徐徐完成签到,获得积分10
41秒前
41秒前
科研通AI5应助干净绿真采纳,获得10
43秒前
司徒寒烟发布了新的文献求助10
43秒前
iu1392发布了新的文献求助10
44秒前
不来完成签到,获得积分10
44秒前
45秒前
愉快的犀牛完成签到 ,获得积分10
47秒前
zxy发布了新的文献求助10
50秒前
53秒前
完美世界应助iu1392采纳,获得10
55秒前
57秒前
57秒前
李健的粉丝团团长应助zxy采纳,获得10
58秒前
cyf完成签到 ,获得积分10
58秒前
科研通AI2S应助木鸽子采纳,获得10
58秒前
大个应助大豹子采纳,获得10
1分钟前
高分求助中
Technologies supporting mass customization of apparel: A pilot project 600
Introduction to Strong Mixing Conditions Volumes 1-3 500
Tip60 complex regulates eggshell formation and oviposition in the white-backed planthopper, providing effective targets for pest control 400
A Field Guide to the Amphibians and Reptiles of Madagascar - Frank Glaw and Miguel Vences - 3rd Edition 400
China Gadabouts: New Frontiers of Humanitarian Nursing, 1941–51 400
The Healthy Socialist Life in Maoist China, 1949–1980 400
Walking a Tightrope: Memories of Wu Jieping, Personal Physician to China's Leaders 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3798422
求助须知:如何正确求助?哪些是违规求助? 3343818
关于积分的说明 10317793
捐赠科研通 3060542
什么是DOI,文献DOI怎么找? 1679588
邀请新用户注册赠送积分活动 806729
科研通“疑难数据库(出版商)”最低求助积分说明 763296