VF-Fuse: a dual-path feature fusion and iterative update architecture for virulence factor prediction.

保险丝(电气) 毒力因子 路径(计算) 特征(语言学) 计算机科学 对偶(语法数字) 因子(编程语言) 毒力 建筑 人工智能 生物 工程类 基因 程序设计语言 电气工程 遗传学 艺术 语言学 哲学 文学类 视觉艺术
作者
Lucheng Huang,Xiangyu Yu,Shumei Li,Qingwei Chen,Dan Xu,Qi Zhao
出处
期刊:PubMed 卷期号:26 (5)
标识
DOI:10.1093/bib/bbaf481
摘要

Accurate prediction of bacterial virulence factors (VFs) is crucial for combating infectious diseases, yet traditional methods often fail to capture their complex sequence properties. We address this challenge by leveraging deep, context-aware representations from large-scale protein language models (PLMs). Our framework begins with a systematic engineering of features from ESM-2 and ProtT5, which confirmed their complementary nature but also revealed that simple concatenation is a suboptimal fusion strategy due to a "feature overshadowing" effect. To overcome this, we developed two novel architectures: VF-Iter, for robust feature enhancement via iterative low-rank updates, and the Dual-Path Feature Fusion (DPF) network, for intelligently integrating the complementary embeddings. The construction of our final model, VF-Fuse, involved a two-stage process. First, we selected four powerful and diverse base models representing our distinct feature strategies (ESM-2 only, ProtT5 only, simple concatenation, and DPF). Second, we empirically determined the best method for combining their predictions by benchmarking 15 ensemble techniques, from which Majority Voting emerged as the superior choice. On the independent test set, VF-Fuse establishes a new state of the art, achieving a superior F1-Score of 87.15% and a Matthews Correlation Coefficient of 73.61%. This F1-Score marks a significant 3.3% improvement over the previous best method, driven by an excellent balance between a high Sensitivity of 90.1% and a strong Specificity of 83.33%. Crucially, in-depth interpretability analyses validated our architectural design, demonstrating how the DPF model learns to intelligently route complementary features to specialized pathways.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
失眠的冬易完成签到 ,获得积分10
1秒前
小蜻蜓完成签到,获得积分10
4秒前
四斤瓜完成签到 ,获得积分10
7秒前
风信子deon01完成签到,获得积分10
10秒前
Raki完成签到,获得积分10
16秒前
舒适的天奇完成签到 ,获得积分10
19秒前
Yes0419完成签到,获得积分10
27秒前
冷傲菠萝完成签到 ,获得积分10
28秒前
wBw完成签到,获得积分0
28秒前
冬夏完成签到,获得积分10
34秒前
firewood完成签到,获得积分10
35秒前
lamer完成签到,获得积分10
35秒前
cq_2完成签到,获得积分0
35秒前
可爱可愁完成签到,获得积分10
41秒前
54秒前
搬砖的化学男完成签到 ,获得积分0
55秒前
专注的觅云完成签到 ,获得积分10
56秒前
56秒前
Noah完成签到 ,获得积分0
57秒前
jimskylxk发布了新的文献求助10
57秒前
HLT完成签到 ,获得积分10
1分钟前
terryok完成签到,获得积分10
1分钟前
jimskylxk完成签到,获得积分10
1分钟前
禾禾禾完成签到 ,获得积分10
1分钟前
小嚣张完成签到,获得积分10
1分钟前
亲爱的桃乐茜完成签到 ,获得积分10
1分钟前
嘉子完成签到 ,获得积分10
1分钟前
1797472009完成签到 ,获得积分10
1分钟前
monster完成签到 ,获得积分10
1分钟前
开心的人杰完成签到,获得积分10
1分钟前
小郭完成签到 ,获得积分10
1分钟前
jagger完成签到,获得积分10
1分钟前
1分钟前
advance完成签到,获得积分10
1分钟前
馆长应助栗子采纳,获得20
1分钟前
jameslee04完成签到 ,获得积分10
1分钟前
yuan1226完成签到 ,获得积分10
1分钟前
康复小白完成签到 ,获得积分10
1分钟前
1分钟前
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Encyclopedia of Solid-Liquid Interfaces 600
A study of torsion fracture tests 510
Narrative Method and Narrative form in Masaccio's Tribute Money 500
Aircraft Engine Design, Third Edition 500
Neonatal and Pediatric ECMO Simulation Scenarios 500
苏州地下水中新污染物及其转化产物的非靶向筛查 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4754444
求助须知:如何正确求助?哪些是违规求助? 4098271
关于积分的说明 12679128
捐赠科研通 3811990
什么是DOI,文献DOI怎么找? 2104413
邀请新用户注册赠送积分活动 1129607
关于科研通互助平台的介绍 1007278