PhaGenus: genus-level classification of bacteriophages using a Transformer model

康蒂格 复制 计算机科学 生物分类 人工智能 机器学习 生物 计算生物学 遗传学 进化生物学 基因 基因组 数学 统计
作者
Jiaojiao Guan,Peng Cheng,Jiayu Shang,Xubo Tang,Yanni Sun
出处
期刊:Briefings in Bioinformatics [Oxford University Press]
卷期号:24 (6)
标识
DOI:10.1093/bib/bbad408
摘要

Abstract Motivation Bacteriophages (phages for short), which prey on and replicate within bacterial cells, have a significant role in modulating microbial communities and hold potential applications in treating antibiotic resistance. The advancement of high-throughput sequencing technology contributes to the discovery of phages tremendously. However, the taxonomic classification of assembled phage contigs still faces several challenges, including high genetic diversity, lack of a stable taxonomy system and limited knowledge of phage annotations. Despite extensive efforts, existing tools have not yet achieved an optimal balance between prediction rate and accuracy. Results In this work, we develop a learning-based model named PhaGenus, which conducts genus-level taxonomic classification for phage contigs. PhaGenus utilizes a powerful Transformer model to learn the association between protein clusters and support the classification of up to 508 genera. We tested PhaGenus on four datasets in different scenarios. The experimental results show that PhaGenus outperforms state-of-the-art methods in predicting low-similarity datasets, achieving an improvement of at least 13.7%. Additionally, PhaGenus is highly effective at identifying previously uncharacterized genera that are not represented in reference databases, with an improvement of 8.52%. The analysis of the infants’ gut and GOV2.0 dataset demonstrates that PhaGenus can be used to classify more contigs with higher accuracy.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
4秒前
sansan发布了新的文献求助10
4秒前
6秒前
6秒前
吱吱吱吱发布了新的文献求助10
8秒前
温阳发布了新的文献求助10
8秒前
十字水瓶完成签到,获得积分10
9秒前
10秒前
小蘑菇应助壮观艳采纳,获得10
13秒前
Rando发布了新的文献求助10
13秒前
14秒前
sansan完成签到,获得积分10
15秒前
背后的无声完成签到,获得积分20
15秒前
16秒前
17秒前
物外完成签到,获得积分10
17秒前
香蕉笑阳完成签到,获得积分10
18秒前
star完成签到 ,获得积分10
20秒前
Rando完成签到,获得积分10
20秒前
21秒前
22秒前
完美世界应助端庄沛山采纳,获得10
22秒前
领导范儿应助ARIA采纳,获得10
22秒前
Hello应助背后的无声采纳,获得10
22秒前
蓝天发布了新的文献求助100
23秒前
24秒前
猪猪侠发布了新的文献求助10
24秒前
25秒前
25秒前
时尚红酒完成签到,获得积分10
30秒前
南宫曼卉发布了新的文献求助30
30秒前
为万世开太平完成签到,获得积分20
30秒前
suki发布了新的文献求助10
31秒前
科研通AI6.4应助羊羊羊采纳,获得10
31秒前
闫淑雅发布了新的文献求助10
32秒前
orchid完成签到,获得积分10
33秒前
33秒前
35秒前
端庄沛山完成签到,获得积分10
35秒前
高分求助中
Principles of Economics, 11th Edition 10000
Prescott's Microbiology: 2026 Release ISE 10000
University Physics with Modern Physics, 16th edition 10000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Environmental Leverage in Times of Climate Crisis: Product Standards, Carbon Border Measures and Preferential Trade Agreements 1000
Interactions of Vowel Quality and Prosody in East Slavic 1000
Erwählung und Berufung bei Paulus: Bedeutung, Entwicklung und Funktion einer Vorstellung in ihrem frühjüdischen und griechisch-römischen Kontext 850
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 内科学 物理 复合材料 催化作用 细胞生物学 无机化学 光电子学 物理化学 电极 基因
热门帖子
关注 科研通微信公众号,转发送积分 7176339
求助须知:如何正确求助?哪些是违规求助? 8816420
关于积分的说明 18624684
捐赠科研通 6796038
什么是DOI,文献DOI怎么找? 3169447
关于科研通互助平台的介绍 2313406
邀请新用户注册赠送积分活动 2144258