Structure-Aware Multimodal Deep Learning for Drug–Protein Interaction Prediction

计算机科学 水准点(测量) 人工智能 机器学习 代表(政治) 人工神经网络 数据挖掘 均方误差 数据集 特征学习 蛋白质结构预测 药物发现 试验装置 深度学习 图形 集合(抽象数据类型) 训练集 模式识别(心理学) 蛋白质结构 生物信息学 理论计算机科学 数学 法学 程序设计语言 地理 统计 物理 大地测量学 政治 生物 核磁共振 政治学
作者
Penglei Wang,Shuangjia Zheng,Yize Jiang,Chengtao Li,Junhong Liu,Chang Wen,Atanas Patronov,Dahong Qian,Hongming Chen,Yuedong Yang
出处
期刊:Journal of Chemical Information and Modeling [American Chemical Society]
卷期号:62 (5): 1308-1317 被引量:25
标识
DOI:10.1021/acs.jcim.2c00060
摘要

Identifying drug-protein interactions (DPIs) is crucial in drug discovery, and a number of machine learning methods have been developed to predict DPIs. Existing methods usually use unrealistic data sets with hidden bias, which will limit the accuracy of virtual screening methods. Meanwhile, most DPI prediction methods pay more attention to molecular representation but lack effective research on protein representation and high-level associations between different instances. To this end, we present the novel structure-aware multimodal deep DPI prediction model, STAMP-DPI, which was trained on a curated industry-scale benchmark data set. We built a high-quality benchmark data set named GalaxyDB for DPI prediction. This industry-scale data set along with an unbiased training procedure resulted in a more robust benchmark study. For informative protein representation, we constructed a structure-aware graph neural network method from the protein sequence by combining predicted contact maps and graph neural networks. Through further integration of structure-based representation and high-level pretrained embeddings for molecules and proteins, our model effectively captures the feature representation of the interactions between them. As a result, STAMP-DPI outperformed state-of-the-art DPI prediction methods by decreasing 7.00% mean square error (MSE) in the Davis data set and improving 8.89% area under the curve (AUC) in the GalaxyDB data set. Moreover, our model is an interpretable model with the transformer-based interaction mechanism, which can accurately reveal the binding sites between molecules and proteins.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
建议保存本图,每天支付宝扫一扫(相册选取)领红包
实时播报
pilifeng完成签到 ,获得积分10
8秒前
xslw完成签到 ,获得积分10
16秒前
LiuChuannan完成签到 ,获得积分10
24秒前
vsvsgo完成签到,获得积分10
24秒前
31秒前
逝水完成签到 ,获得积分10
33秒前
陈秋发布了新的文献求助10
48秒前
鲸落完成签到 ,获得积分10
59秒前
KirinLee麒麟完成签到 ,获得积分10
1分钟前
孙某人完成签到 ,获得积分0
1分钟前
执行正义完成签到 ,获得积分10
1分钟前
xue112完成签到 ,获得积分10
1分钟前
1分钟前
冷静新烟完成签到,获得积分10
1分钟前
小薇发布了新的文献求助10
1分钟前
phase完成签到 ,获得积分10
1分钟前
GBZ完成签到 ,获得积分10
2分钟前
小薇完成签到,获得积分20
2分钟前
燕晓啸完成签到 ,获得积分0
2分钟前
xxcvvv完成签到,获得积分0
2分钟前
我的影帝先生完成签到 ,获得积分10
2分钟前
tszjw168完成签到 ,获得积分10
2分钟前
没用的三轮完成签到,获得积分10
2分钟前
简单的战斗机完成签到,获得积分10
2分钟前
菠萝炒蛋加饭完成签到 ,获得积分10
3分钟前
3分钟前
Ozone发布了新的文献求助10
3分钟前
roundtree完成签到 ,获得积分0
3分钟前
gszy1975发布了新的文献求助10
3分钟前
啊一啾完成签到 ,获得积分10
3分钟前
Jack80完成签到,获得积分0
3分钟前
充电宝应助Jack80采纳,获得30
4分钟前
Kevin完成签到,获得积分10
4分钟前
连难胜完成签到 ,获得积分10
4分钟前
鳗鱼老师完成签到 ,获得积分10
4分钟前
拉长的菲音完成签到 ,获得积分10
4分钟前
车剑锋完成签到,获得积分10
4分钟前
isedu完成签到,获得积分10
4分钟前
胡可完成签到 ,获得积分10
4分钟前
iSummer完成签到,获得积分10
5分钟前
高分求助中
Teaching Social and Emotional Learning in Physical Education 1100
Mixed Methods for Psychological Measurement 800
The Instrument Operations and Calibration System for TerraSAR-X 800
FILTRATION OF NODULAR IRON WITH CERAMIC FOAM FILTERS 500
A STUDY OF THE EFFECTS OF CHILLS AND PROCESS-VARIABLES ON THE SOLIDIFICATION OF HEAVY-SECTION DUCTILE IRON CASTINGS 500
INFLUENCE OF METAL VARIABLES ON THE STRUCTURE AND PROPERTIES OF HEAVY SECTION DUCTILE IRON 500
Filtration of inmold ductile iron 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2348031
求助须知:如何正确求助?哪些是违规求助? 2053531
关于积分的说明 5113888
捐赠科研通 1784927
什么是DOI,文献DOI怎么找? 891851
版权声明 556819
科研通“疑难数据库(出版商)”最低求助积分说明 475801