Structure-Aware Multimodal Deep Learning for Drug–Protein Interaction Prediction

计算机科学 水准点(测量) 人工智能 机器学习 代表(政治) 人工神经网络 数据挖掘 均方误差 数据集 特征学习 蛋白质结构预测 药物发现 试验装置 深度学习 图形 集合(抽象数据类型) 训练集 模式识别(心理学) 蛋白质结构 生物信息学 理论计算机科学 数学 法学 程序设计语言 地理 统计 物理 大地测量学 政治 生物 核磁共振 政治学
作者
Penglei Wang,Shuangjia Zheng,Yize Jiang,Chengtao Li,Junhong Liu,Chang Wen,Atanas Patronov,Dahong Qian,Hongming Chen,Yuedong Yang
出处
期刊:Journal of Chemical Information and Modeling [American Chemical Society]
卷期号:62 (5): 1308-1317 被引量:46
标识
DOI:10.1021/acs.jcim.2c00060
摘要

Identifying drug–protein interactions (DPIs) is crucial in drug discovery, and a number of machine learning methods have been developed to predict DPIs. Existing methods usually use unrealistic data sets with hidden bias, which will limit the accuracy of virtual screening methods. Meanwhile, most DPI prediction methods pay more attention to molecular representation but lack effective research on protein representation and high-level associations between different instances. To this end, we present the novel structure-aware multimodal deep DPI prediction model, STAMP-DPI, which was trained on a curated industry-scale benchmark data set. We built a high-quality benchmark data set named GalaxyDB for DPI prediction. This industry-scale data set along with an unbiased training procedure resulted in a more robust benchmark study. For informative protein representation, we constructed a structure-aware graph neural network method from the protein sequence by combining predicted contact maps and graph neural networks. Through further integration of structure-based representation and high-level pretrained embeddings for molecules and proteins, our model effectively captures the feature representation of the interactions between them. As a result, STAMP-DPI outperformed state-of-the-art DPI prediction methods by decreasing 7.00% mean square error (MSE) in the Davis data set and improving 8.89% area under the curve (AUC) in the GalaxyDB data set. Moreover, our model is an interpretable model with the transformer-based interaction mechanism, which can accurately reveal the binding sites between molecules and proteins.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
Lorain发布了新的文献求助30
2秒前
52pry发布了新的文献求助10
4秒前
梦醒时见你完成签到,获得积分10
4秒前
情怀应助科研通管家采纳,获得10
5秒前
领导范儿应助科研通管家采纳,获得10
5秒前
5秒前
科研通AI2S应助科研通管家采纳,获得10
5秒前
5秒前
彭于晏应助HJJHJH采纳,获得20
6秒前
10秒前
粗犷的灵松完成签到,获得积分10
12秒前
水上汀州完成签到,获得积分10
12秒前
目土土完成签到 ,获得积分10
13秒前
GAOGONGZI发布了新的文献求助10
14秒前
jaemina完成签到,获得积分10
14秒前
chen发布了新的文献求助10
16秒前
汉堡包应助skier采纳,获得30
18秒前
星辰大海应助顾小花采纳,获得10
19秒前
佳佳佳发布了新的文献求助10
23秒前
深情安青应助Lmj采纳,获得10
23秒前
上官若男应助moaper采纳,获得10
24秒前
MOON完成签到,获得积分10
25秒前
26秒前
共享精神应助古果采纳,获得10
26秒前
27秒前
30秒前
30秒前
skier发布了新的文献求助30
31秒前
科研通AI5应助追寻的若翠采纳,获得20
32秒前
Lmj完成签到,获得积分20
32秒前
33秒前
33秒前
33秒前
Summer完成签到 ,获得积分10
34秒前
mengli完成签到 ,获得积分10
35秒前
35秒前
Lmj发布了新的文献求助10
36秒前
moaper发布了新的文献求助10
36秒前
柿柿发布了新的文献求助10
36秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Encyclopedia of Geology (2nd Edition) 2000
Maneuvering of a Damaged Navy Combatant 650
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
Mixing the elements of mass customisation 300
the MD Anderson Surgical Oncology Manual, Seventh Edition 300
Nucleophilic substitution in azasydnone-modified dinitroanisoles 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3780377
求助须知:如何正确求助?哪些是违规求助? 3325733
关于积分的说明 10224120
捐赠科研通 3040823
什么是DOI,文献DOI怎么找? 1669080
邀请新用户注册赠送积分活动 799013
科研通“疑难数据库(出版商)”最低求助积分说明 758649