Effective binning of metagenomic contigs using contrastive multi-view representation learning

康蒂格 基因组 计算机科学 基因组 人工智能 代表(政治) 计算生物学 数据挖掘 模式识别(心理学) 生物 基因 遗传学 政治 政治学 法学
作者
Ziye Wang,Ronghui You,Haitao Han,Wei Liu,Fengzhu Sun,Shanfeng Zhu
出处
期刊:Nature Communications [Nature Portfolio]
卷期号:15 (1) 被引量:29
标识
DOI:10.1038/s41467-023-44290-z
摘要

Abstract Contig binning plays a crucial role in metagenomic data analysis by grouping contigs from the same or closely related genomes. However, existing binning methods face challenges in practical applications due to the diversity of data types and the difficulties in efficiently integrating heterogeneous information. Here, we introduce COMEBin, a binning method based on contrastive multi-view representation learning. COMEBin utilizes data augmentation to generate multiple fragments (views) of each contig and obtains high-quality embeddings of heterogeneous features (sequence coverage and k-mer distribution) through contrastive learning. Experimental results on multiple simulated and real datasets demonstrate that COMEBin outperforms state-of-the-art binning methods, particularly in recovering near-complete genomes from real environmental samples. COMEBin outperforms other binning methods remarkably when integrated into metagenomic analysis pipelines, including the recovery of potentially pathogenic antibiotic-resistant bacteria (PARB) and moderate or higher quality bins containing potential biosynthetic gene clusters (BGCs).
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
刚刚
浅笑宝宝完成签到,获得积分10
刚刚
NEM嬛嬛驾到完成签到,获得积分10
刚刚
ZXCVB完成签到,获得积分10
1秒前
xyzlancet完成签到,获得积分10
1秒前
zhiren完成签到,获得积分10
2秒前
不羁完成签到 ,获得积分10
2秒前
zyc发布了新的文献求助10
2秒前
2秒前
从容以山完成签到,获得积分10
3秒前
3秒前
3秒前
故事细腻发布了新的文献求助10
4秒前
顶顶小明完成签到,获得积分10
4秒前
整齐乘风完成签到,获得积分10
4秒前
再睡一夏完成签到,获得积分10
5秒前
zzx发布了新的文献求助10
5秒前
zhang完成签到 ,获得积分10
5秒前
林洛沁关注了科研通微信公众号
6秒前
6秒前
serena完成签到 ,获得积分10
6秒前
7秒前
Balance Man发布了新的文献求助30
7秒前
慕青应助haorandu采纳,获得10
7秒前
7秒前
7秒前
wlincarol完成签到,获得积分10
7秒前
小路完成签到,获得积分10
7秒前
板栗板栗发布了新的文献求助10
8秒前
Xavier完成签到 ,获得积分10
8秒前
优秀的叫兽完成签到,获得积分20
9秒前
18298859129完成签到,获得积分10
9秒前
liangguangyuan完成签到 ,获得积分0
9秒前
yulinhai完成签到,获得积分10
9秒前
大胆诗霜完成签到,获得积分10
10秒前
10秒前
吴龙完成签到,获得积分10
10秒前
干净的雅青完成签到,获得积分10
10秒前
10秒前
高分求助中
Cronologia da história de Macau 1600
Treatment response-adapted risk index model for survival prediction and adjuvant chemotherapy selection in nonmetastatic nasopharyngeal carcinoma 1000
Lloyd's Register of Shipping's Approach to the Control of Incidents of Brittle Fracture in Ship Structures 1000
BRITTLE FRACTURE IN WELDED SHIPS 1000
Intentional optical interference with precision weapons (in Russian) Преднамеренные оптические помехи высокоточному оружию 1000
Atlas of Anatomy 5th original digital 2025的PDF高清电子版(非压缩版,大小约400-600兆,能更大就更好了) 1000
Current concept for improving treatment of prostate cancer based on combination of LH-RH agonists with other agents 1000
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 纳米技术 计算机科学 化学工程 生物化学 物理 复合材料 内科学 催化作用 物理化学 光电子学 细胞生物学 基因 电极 遗传学
热门帖子
关注 科研通微信公众号,转发送积分 6188781
求助须知:如何正确求助?哪些是违规求助? 8016233
关于积分的说明 16676069
捐赠科研通 5286177
什么是DOI,文献DOI怎么找? 2817667
邀请新用户注册赠送积分活动 1797190
关于科研通互助平台的介绍 1661433