清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

HitScreen: A Sequence-Based Drug Virtual Screening Approach Using Data Augmentation and Protein Language Models

可解释性 计算机科学 注释 虚拟筛选 人工智能 机器学习 编码 一般化 班级(哲学) 语言模型 药物发现 数据挖掘 桥(图论) 集成学习 药物靶点 标记数据 机制(生物学) 分类器(UML) 标杆管理 集合预报
作者
Geng Chen,Jinbiao Liao,Yanzhen Yu,Kien Trung Le,Hui Zhao,Yiyang Qin,Lvtao Cai,Rong Sheng
出处
期刊:Journal of Chemical Information and Modeling [American Chemical Society]
卷期号:65 (19): 10152-10166 被引量:1
标识
DOI:10.1021/acs.jcim.5c01753
摘要

Sequence-based drug-target interaction (DTI) prediction is an effective approach for identifying potential drug candidates without relying on three-dimensional protein structures. However, current sequence-based methods often suffer from limited generalization to novel targets and fail to capture essential spatial interaction features. As a result, they exhibit a significant performance gap compared with structure-based methods. To bridge this gap, we propose HitScreen, a robust deep learning framework specifically designed for sequence-based DTI prediction, applied to virtual screening scenarios. We introduce a conditional label inversion strategy to address class imbalance, annotation biases, and ligand biases in the data sets. HitScreen integrates multiple pretrained protein language models (Ankh, ESM-2, ProtT5) alongside the molecular pretrained model Uni-Mol to encode spatial information. Additionally, HitScreen utilizes a cross-attention mechanism to capture local intermolecular interactions between drug molecules and protein sequences. Rigorous benchmarking on independent data sets (DEKOIS2.0 and DUD-E) demonstrates that HitScreen achieves performance comparable to or surpassing state-of-the-art structure-based methods, while relying solely on protein sequence information. Comprehensive interpretability analyses further validate how the model accurately identifies biologically relevant molecular interactions, providing valuable insights into rational drug design. In summary, these findings demonstrate HitScreen as a robust, interpretable, and broadly applicable framework for DTI prediction with applications in sequence-based drug virtual screening.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
蔡勇强完成签到 ,获得积分10
6秒前
jnshen完成签到 ,获得积分10
19秒前
meimei完成签到 ,获得积分10
25秒前
周周周完成签到 ,获得积分10
28秒前
巫马尔槐发布了新的文献求助10
38秒前
Ta沓如流星完成签到,获得积分10
43秒前
发发接接ac完成签到 ,获得积分10
43秒前
小文殊完成签到 ,获得积分10
46秒前
领导范儿应助Ta沓如流星采纳,获得10
55秒前
巫马尔槐发布了新的文献求助10
58秒前
yl完成签到,获得积分10
1分钟前
属实有点拉胯完成签到 ,获得积分10
1分钟前
一一得一关注了科研通微信公众号
1分钟前
cwanglh完成签到 ,获得积分10
1分钟前
nav完成签到 ,获得积分10
1分钟前
似水流年完成签到 ,获得积分10
1分钟前
xianyaoz完成签到 ,获得积分0
1分钟前
巫马尔槐完成签到,获得积分10
1分钟前
1分钟前
rjy完成签到 ,获得积分10
1分钟前
cheche完成签到,获得积分10
1分钟前
PeterLin完成签到,获得积分10
1分钟前
吉吉国王完成签到 ,获得积分10
1分钟前
cheche发布了新的文献求助10
1分钟前
1分钟前
手术刀完成签到 ,获得积分10
1分钟前
朴素浩然完成签到,获得积分10
2分钟前
大大完成签到 ,获得积分10
2分钟前
朴素浩然发布了新的文献求助10
2分钟前
雪山飞龙发布了新的文献求助10
2分钟前
科研通AI6.2应助朴素浩然采纳,获得10
2分钟前
Turing完成签到,获得积分10
2分钟前
2026成功上岸完成签到 ,获得积分10
2分钟前
2分钟前
时尚的访琴完成签到 ,获得积分10
2分钟前
2分钟前
钱学森完成签到,获得积分10
2分钟前
Laser_eyes完成签到,获得积分10
2分钟前
斯文的初蝶完成签到,获得积分20
2分钟前
逍遥子完成签到,获得积分10
2分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
晶种分解过程与铝酸钠溶液混合强度关系的探讨 8888
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
Leading Academic-Practice Partnerships in Nursing and Healthcare: A Paradigm for Change 800
The formation of Australian attitudes towards China, 1918-1941 640
Signals, Systems, and Signal Processing 610
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6427704
求助须知:如何正确求助?哪些是违规求助? 8244568
关于积分的说明 17528147
捐赠科研通 5483082
什么是DOI,文献DOI怎么找? 2895067
邀请新用户注册赠送积分活动 1871251
关于科研通互助平台的介绍 1710176