已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

PhaGenus: genus-level classification of bacteriophages using a Transformer model

康蒂格 复制 计算机科学 生物分类 人工智能 机器学习 生物 计算生物学 遗传学 进化生物学 基因 基因组 数学 统计
作者
Jiaojiao Guan,Peng Cheng,Jiayu Shang,Xubo Tang,Yanni Sun
出处
期刊:Briefings in Bioinformatics [Oxford University Press]
卷期号:24 (6)
标识
DOI:10.1093/bib/bbad408
摘要

Abstract Motivation Bacteriophages (phages for short), which prey on and replicate within bacterial cells, have a significant role in modulating microbial communities and hold potential applications in treating antibiotic resistance. The advancement of high-throughput sequencing technology contributes to the discovery of phages tremendously. However, the taxonomic classification of assembled phage contigs still faces several challenges, including high genetic diversity, lack of a stable taxonomy system and limited knowledge of phage annotations. Despite extensive efforts, existing tools have not yet achieved an optimal balance between prediction rate and accuracy. Results In this work, we develop a learning-based model named PhaGenus, which conducts genus-level taxonomic classification for phage contigs. PhaGenus utilizes a powerful Transformer model to learn the association between protein clusters and support the classification of up to 508 genera. We tested PhaGenus on four datasets in different scenarios. The experimental results show that PhaGenus outperforms state-of-the-art methods in predicting low-similarity datasets, achieving an improvement of at least 13.7%. Additionally, PhaGenus is highly effective at identifying previously uncharacterized genera that are not represented in reference databases, with an improvement of 8.52%. The analysis of the infants’ gut and GOV2.0 dataset demonstrates that PhaGenus can be used to classify more contigs with higher accuracy.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
已经没有海星了完成签到 ,获得积分10
1秒前
半夏完成签到 ,获得积分10
1秒前
fhznuli完成签到,获得积分20
2秒前
傲娇的芫发布了新的文献求助10
5秒前
6秒前
8秒前
Liao完成签到 ,获得积分10
8秒前
活泼鹤轩完成签到,获得积分20
9秒前
哈哈哈完成签到 ,获得积分10
9秒前
光能使者完成签到,获得积分10
10秒前
希望天下0贩的0应助zhang采纳,获得10
10秒前
12秒前
14秒前
15秒前
zxer发布了新的文献求助10
17秒前
17秒前
18秒前
马家辉完成签到,获得积分10
18秒前
康KKKate完成签到 ,获得积分10
19秒前
Lucas应助傲娇的芫采纳,获得10
21秒前
zhang发布了新的文献求助10
22秒前
iiiiiur完成签到,获得积分10
22秒前
刘宁完成签到 ,获得积分20
24秒前
星辰大海应助雪时晴采纳,获得10
25秒前
ych62524发布了新的文献求助10
25秒前
jakie完成签到,获得积分10
27秒前
27秒前
Trends完成签到 ,获得积分10
30秒前
朝气完成签到,获得积分10
31秒前
31秒前
33秒前
罗零完成签到 ,获得积分10
35秒前
Lucas应助zxer采纳,获得10
36秒前
充电宝应助雪时晴采纳,获得10
37秒前
Jasper应助哈比人linling采纳,获得10
40秒前
奥特超曼完成签到,获得积分10
41秒前
42秒前
耶耶耶耶宝完成签到,获得积分10
42秒前
快乐翠桃完成签到 ,获得积分10
43秒前
WizBLue完成签到,获得积分10
52秒前
高分求助中
Sustainable Land Management: Strategies to Cope with the Marginalisation of Agriculture 1000
Corrosion and Oxygen Control 600
Yaws' Handbook of Antoine coefficients for vapor pressure 500
Python Programming for Linguistics and Digital Humanities: Applications for Text-Focused Fields 500
Love and Friendship in the Western Tradition: From Plato to Postmodernity 500
行動データの計算論モデリング 強化学習モデルを例として 500
Johann Gottlieb Fichte: Die späten wissenschaftlichen Vorlesungen / IV,1: ›Transzendentale Logik I (1812)‹ 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2556350
求助须知:如何正确求助?哪些是违规求助? 2180259
关于积分的说明 5623399
捐赠科研通 1901624
什么是DOI,文献DOI怎么找? 949913
版权声明 565607
科研通“疑难数据库(出版商)”最低求助积分说明 504846