Feature selection methods affect the performance of scRNA-seq data integration and querying

特征选择 水准点(测量) 计算机科学 特征(语言学) 选择(遗传算法) 数据集成 数据挖掘 最小冗余特征选择 人工智能 语言学 哲学 大地测量学 地理
作者
Luke Zappia,Sabrina Richter,Ciro Ramírez-Suástegui,Raphael Kfuri-Rubens,Larsen Vornholz,W. Wang,Oliver Dietrich,Amit Frishberg,Malte D. Luecken,Fabian J. Theis
出处
期刊:Nature Methods [Nature Portfolio]
标识
DOI:10.1038/s41592-025-02624-3
摘要

Abstract The availability of single-cell transcriptomics has allowed the construction of reference cell atlases, but their usefulness depends on the quality of dataset integration and the ability to map new samples. Previous benchmarks have compared integration methods and suggest that feature selection improves performance but have not explored how best to select features. Here, we benchmark feature selection methods for single-cell RNA sequencing integration using metrics beyond batch correction and preservation of biological variation to assess query mapping, label transfer and the detection of unseen populations. We reinforce common practice by showing that highly variable feature selection is effective for producing high-quality integrations and provide further guidance on the effect of the number of features selected, batch-aware feature selection, lineage-specific feature selection and integration and the interaction between feature selection and integration models. These results are informative for analysts working on large-scale tissue atlases, using atlases or integrating their own data to tackle specific biological questions.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
bkagyin应助南浅采纳,获得10
1秒前
略略略完成签到,获得积分10
3秒前
翁若翠发布了新的文献求助10
4秒前
Ade发布了新的文献求助10
6秒前
6秒前
科研通AI5应助执着乐双采纳,获得10
8秒前
hyhy完成签到,获得积分10
8秒前
Kevin Huang完成签到,获得积分10
9秒前
彳亍完成签到,获得积分10
9秒前
10秒前
roaring发布了新的文献求助10
11秒前
冰魂应助zsj采纳,获得10
14秒前
科目三应助整齐凌萱采纳,获得10
15秒前
852应助王佳豪采纳,获得10
15秒前
17秒前
19秒前
19秒前
Lucas应助翁若翠采纳,获得10
20秒前
乐乐应助宗友绿采纳,获得10
20秒前
wy.he应助科研通管家采纳,获得10
20秒前
科研通AI5应助科研通管家采纳,获得10
20秒前
科目三应助科研通管家采纳,获得10
20秒前
科研通AI5应助科研通管家采纳,获得150
20秒前
酷波er应助科研通管家采纳,获得50
20秒前
wy.he应助科研通管家采纳,获得10
20秒前
21秒前
打打应助科研通管家采纳,获得10
21秒前
Orange应助科研通管家采纳,获得10
21秒前
wanci应助科研通管家采纳,获得10
21秒前
大个应助科研通管家采纳,获得10
21秒前
21秒前
思源应助科研通管家采纳,获得10
21秒前
科研通AI2S应助科研通管家采纳,获得10
21秒前
22秒前
好人一生平安完成签到,获得积分10
23秒前
小周完成签到,获得积分10
23秒前
端庄的新瑶完成签到,获得积分20
23秒前
南浅发布了新的文献求助10
24秒前
丁莞发布了新的文献求助10
24秒前
25秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
Maneuvering of a Damaged Navy Combatant 650
Mixing the elements of mass customisation 300
the MD Anderson Surgical Oncology Manual, Seventh Edition 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3778170
求助须知:如何正确求助?哪些是违规求助? 3323851
关于积分的说明 10215999
捐赠科研通 3039020
什么是DOI,文献DOI怎么找? 1667747
邀请新用户注册赠送积分活动 798383
科研通“疑难数据库(出版商)”最低求助积分说明 758339