A machine learning strategy with clustering under sampling of majority instances for predicting drug target interactions**

公共化学 计算机科学 聚类分析 机器学习 化学信息学 药物发现 水准点(测量) 人工智能 特征选择 数据挖掘 采样(信号处理) 特征(语言学) 嵌入 生物信息学 计算生物学 生物 语言学 哲学 大地测量学 滤波器(信号处理) 计算机视觉 地理
作者
Tanya Liyaqat,Tanvir Ahmad
出处
期刊:Molecular Informatics [Wiley]
卷期号:: 2200102-2200102
标识
DOI:10.1002/minf.202200102
摘要

Drug Target Interactions (DTIs) are crucial in drug discovery as it reduces the range of candidate searches, speeding up the drug screening process. Considering in vitro and in vivo experimentations are time and cost-expensive, there has been a surge in computational techniques, especially ML methods for DTIs prediction. Therefore, this study aims to present a methodology that uses molecular structures and amino acid sequences for generating PSSM and PubChem fingerprints for drugs and targets respectively. The proposed work uses a novel technique NearestCUS for handling the class imbalance problem of the benchmark datasets. We use Isomap Embedding to extract features from PSSMs. Feature selection is performed using ANOVA. CatBoost is used for predicting the interaction between drugs and targets for the first time. To quantify the efficacy of NearestCUS, we compared it with other sampling techniques. We found that the proposed methodology performed better than state-of-the-art approaches.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
欢呼煎蛋发布了新的文献求助10
1秒前
4秒前
Bin关闭了Bin文献求助
5秒前
ckz完成签到,获得积分10
5秒前
Peggy完成签到,获得积分10
6秒前
IIII完成签到,获得积分10
7秒前
9秒前
olivia发布了新的文献求助10
10秒前
科研通AI2S应助糖豆采纳,获得10
10秒前
13秒前
今夕何夕发布了新的文献求助10
13秒前
15秒前
17秒前
kk发布了新的文献求助10
19秒前
Jasper应助莲子粥采纳,获得10
19秒前
打打应助欢呼煎蛋采纳,获得30
19秒前
20秒前
orixero应助科研通管家采纳,获得10
21秒前
今后应助科研通管家采纳,获得10
21秒前
酷波er应助科研通管家采纳,获得30
21秒前
21秒前
阿飘应助科研通管家采纳,获得10
21秒前
21秒前
Ava应助科研通管家采纳,获得10
21秒前
zmnzmnzmn应助科研通管家采纳,获得10
21秒前
搜集达人应助科研通管家采纳,获得10
21秒前
赘婿应助科研通管家采纳,获得10
21秒前
xjyyy完成签到 ,获得积分10
21秒前
21秒前
LSW发布了新的文献求助10
22秒前
humengxiao发布了新的文献求助10
22秒前
淋湿的雨发布了新的文献求助10
23秒前
潇潇雨歇发布了新的文献求助10
25秒前
哭泣的映寒完成签到 ,获得积分10
28秒前
mengliu完成签到,获得积分10
29秒前
要懒死了hhh完成签到,获得积分10
33秒前
我要读博士完成签到 ,获得积分10
36秒前
36秒前
LSW完成签到,获得积分20
39秒前
太叔丹翠完成签到 ,获得积分10
41秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
ISCN 2024 – An International System for Human Cytogenomic Nomenclature (2024) 3000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
Maneuvering of a Damaged Navy Combatant 650
Fashion Brand Visual Design Strategy Based on Value Co-creation 350
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3777918
求助须知:如何正确求助?哪些是违规求助? 3323458
关于积分的说明 10214533
捐赠科研通 3038671
什么是DOI,文献DOI怎么找? 1667606
邀请新用户注册赠送积分活动 798207
科研通“疑难数据库(出版商)”最低求助积分说明 758315