MPSol: A Multimodal Prompt Learning Framework for Protein Solubility Prediction

计算机科学 编码 人工智能 蛋白质-蛋白质相互作用 机器学习 财产(哲学) 溶解度 蛋白质结构预测 融合 语义学(计算机科学) 自然语言处理 计算复杂性理论 深度学习 编码(内存) 模式识别(心理学) 组分(热力学) 结构化预测 传感器融合
作者
Yuhang Zhang,Peilin Chen,Keyan Ding,Han Liu,Shiqi Wang,Qi Song
出处
期刊:IEEE Journal of Biomedical and Health Informatics [Institute of Electrical and Electronics Engineers]
卷期号:29 (12): 8807-8814
标识
DOI:10.1109/jbhi.2025.3608273
摘要

Protein solubility is a critical determinant of biologic candidates' developability, stability, and therapeutic efficacy. However, accurate solubility prediction remains a central challenge in computational protein engineering due to the inherent complexity within protein sequences. In this work, we propose a multimodal prompt learning framework, called MPSol, for protein solubility prediction that integrates complementary representations derived from primary sequences, structural proxies, and textual descriptions generated by large language models (LLMs). MPSol is built upon a unified multimodal backbone with a dedicated cross-modal fusion module that captures fine-grained interactions across modalities. In addition, we design label-aware prompts that encode solubility-specific semantic cues associated with each class. These prompts provide semantic supervision, guiding the alignment of fused protein representations to promote semantic consistency. Extensive experiments demonstrate that MPSol achieves state-of-the-art performance, reaching an accuracy of 0.815, AUC of 0.867 and MCC of 0.642 on the standard PDBSol test set, and generalizes well to the external out-of-distribution test dataset with an accuracy of 0.632, AUC of 0.653 and MCC of 0.332. These results underscore the potential of prompt-driven multimodal learning for interpretable and effective protein property prediction.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
mljever完成签到,获得积分10
1秒前
CCCCCL完成签到,获得积分10
1秒前
1秒前
义气馒头完成签到,获得积分10
1秒前
Lucas应助烂漫的莹芝采纳,获得10
1秒前
2秒前
最蠢的讨厌鬼完成签到,获得积分10
2秒前
梦初醒处完成签到,获得积分10
2秒前
zhonglv7应助Wangyingjie5采纳,获得10
2秒前
墨与白发布了新的文献求助10
3秒前
留丁发布了新的文献求助10
3秒前
胖豆发布了新的文献求助10
3秒前
shamy夫妇完成签到,获得积分10
3秒前
kmoonkkk发布了新的文献求助20
3秒前
3秒前
4秒前
xmyang完成签到,获得积分10
4秒前
wb完成签到,获得积分10
4秒前
daigang完成签到,获得积分10
4秒前
wanci应助栀子采纳,获得10
5秒前
5秒前
优美的可乐完成签到,获得积分20
6秒前
6秒前
叶等等完成签到 ,获得积分10
6秒前
手可摘星辰不去高声语完成签到,获得积分10
6秒前
6秒前
田様应助HaiyunChen采纳,获得10
7秒前
七安完成签到 ,获得积分10
7秒前
司佳雨发布了新的文献求助10
7秒前
小野狼完成签到,获得积分0
7秒前
ysw完成签到 ,获得积分10
7秒前
8秒前
杨杨完成签到,获得积分10
8秒前
殷勤的雨灵完成签到,获得积分10
8秒前
djxdjt发布了新的文献求助10
8秒前
8秒前
周洋完成签到,获得积分10
8秒前
9秒前
科目三应助zzz采纳,获得10
9秒前
Orange应助团结友爱采纳,获得10
9秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Quality by Design - An Indispensable Approach to Accelerate Biopharmaceutical Product Development 800
Pulse width control of a 3-phase inverter with non sinusoidal phase voltages 777
Signals, Systems, and Signal Processing 610
Research Methods for Applied Linguistics: A Practical Guide 600
Research Methods for Applied Linguistics 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6404867
求助须知:如何正确求助?哪些是违规求助? 8223987
关于积分的说明 17432949
捐赠科研通 5457386
什么是DOI,文献DOI怎么找? 2883861
邀请新用户注册赠送积分活动 1860087
关于科研通互助平台的介绍 1701425