已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

HitScreen: A Sequence-Based Drug Virtual Screening Approach Using Data Augmentation and Protein Language Models

可解释性 计算机科学 注释 虚拟筛选 人工智能 机器学习 编码 一般化 班级(哲学) 语言模型 药物发现 数据挖掘 桥(图论) 集成学习 药物靶点 标记数据 机制(生物学) 分类器(UML) 标杆管理 集合预报
作者
Geng Chen,Jinbiao Liao,Yanzhen Yu,Kien Trung Le,Hui Zhao,Yiyang Qin,Lvtao Cai,Rong Sheng
出处
期刊:Journal of Chemical Information and Modeling [American Chemical Society]
卷期号:65 (19): 10152-10166 被引量:1
标识
DOI:10.1021/acs.jcim.5c01753
摘要

Sequence-based drug-target interaction (DTI) prediction is an effective approach for identifying potential drug candidates without relying on three-dimensional protein structures. However, current sequence-based methods often suffer from limited generalization to novel targets and fail to capture essential spatial interaction features. As a result, they exhibit a significant performance gap compared with structure-based methods. To bridge this gap, we propose HitScreen, a robust deep learning framework specifically designed for sequence-based DTI prediction, applied to virtual screening scenarios. We introduce a conditional label inversion strategy to address class imbalance, annotation biases, and ligand biases in the data sets. HitScreen integrates multiple pretrained protein language models (Ankh, ESM-2, ProtT5) alongside the molecular pretrained model Uni-Mol to encode spatial information. Additionally, HitScreen utilizes a cross-attention mechanism to capture local intermolecular interactions between drug molecules and protein sequences. Rigorous benchmarking on independent data sets (DEKOIS2.0 and DUD-E) demonstrates that HitScreen achieves performance comparable to or surpassing state-of-the-art structure-based methods, while relying solely on protein sequence information. Comprehensive interpretability analyses further validate how the model accurately identifies biologically relevant molecular interactions, providing valuable insights into rational drug design. In summary, these findings demonstrate HitScreen as a robust, interpretable, and broadly applicable framework for DTI prediction with applications in sequence-based drug virtual screening.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
现代谷芹完成签到 ,获得积分10
刚刚
1秒前
科研通AI2S应助小圆采纳,获得10
1秒前
小太阳哈哈完成签到 ,获得积分10
3秒前
4秒前
Math7发布了新的文献求助10
4秒前
可爱的函函应助tt采纳,获得10
4秒前
5秒前
桐桐应助misaaaa采纳,获得10
5秒前
852应助misaaaa采纳,获得10
5秒前
彭于晏应助sss采纳,获得10
6秒前
6秒前
科研通AI6.3应助Huuuuuur采纳,获得10
6秒前
标致无血发布了新的文献求助10
6秒前
科研通AI6.1应助Huuuuuur采纳,获得10
6秒前
permanent发布了新的文献求助10
8秒前
李健的粉丝团团长应助blue采纳,获得30
8秒前
9秒前
张琴发布了新的文献求助10
10秒前
holly发布了新的文献求助10
10秒前
12秒前
13秒前
tt完成签到,获得积分10
13秒前
华仔应助小二采纳,获得10
13秒前
6682完成签到,获得积分10
13秒前
科研通AI2S应助眉间一把刀采纳,获得10
15秒前
16秒前
17秒前
Ava应助江酒采纳,获得10
17秒前
追梦的小孩子完成签到,获得积分10
18秒前
jiayouya发布了新的文献求助20
18秒前
Damon完成签到 ,获得积分10
18秒前
辛勤的豆芽完成签到,获得积分10
19秒前
小木子发布了新的文献求助10
21秒前
李彪完成签到,获得积分10
21秒前
23秒前
24秒前
cc发布了新的文献求助10
24秒前
bkagyin应助仲松思采纳,获得10
24秒前
Eina完成签到,获得积分20
25秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Quality by Design - An Indispensable Approach to Accelerate Biopharmaceutical Product Development 800
Pulse width control of a 3-phase inverter with non sinusoidal phase voltages 777
Signals, Systems, and Signal Processing 610
Research Methods for Applied Linguistics: A Practical Guide 600
Research Methods for Applied Linguistics 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6404060
求助须知:如何正确求助?哪些是违规求助? 8223105
关于积分的说明 17428427
捐赠科研通 5456437
什么是DOI,文献DOI怎么找? 2883489
邀请新用户注册赠送积分活动 1859810
关于科研通互助平台的介绍 1701203