MolFeSCue: Enhancing molecular property prediction in Data-Limited and imbalanced contexts using Few-Shot and contrastive learning

水准点(测量) 一般化 计算机科学 财产(哲学) 源代码 编码(集合论) 班级(哲学) 人工智能 功能(生物学) 任务(项目管理) 机器学习 自然语言处理 数据挖掘 程序设计语言 数学 哲学 认识论 数学分析 管理 大地测量学 集合(抽象数据类型) 进化生物学 经济 生物 地理
作者
Ruochi Zhang,Chao Wu,Qian Yang,Liu Chang,Yan Wang,Kewei Li,Lan Huang,Fengfeng Zhou
出处
期刊:Bioinformatics [Oxford University Press]
标识
DOI:10.1093/bioinformatics/btae118
摘要

Predicting molecular properties is a pivotal task in various scientific domains, including drug discovery, material science, and computational chemistry. This problem is often hindered by the lack of annotated data and imbalanced class distributions, which pose significant challenges in developing accurate and robust predictive models.This study tackles these issues by employing pretrained molecular models within a few-shot learning framework. A novel dynamic contrastive loss function is utilized to further improve model performance in the situation of class imbalance. The proposed MolFeSCue framework not only facilitates rapid generalization from minimal samples, but also employs a contrastive loss function to extract meaningful molecular representations from imbalanced datasets. Extensive evaluations and comparisons of MolFeSCue and state-of-the-art algorithms have been conducted on multiple benchmark datasets, and the experimental data demonstrate our algorithm's effectiveness in molecular representations and its broad applicability across various pretrained models. Our findings underscore MolFeSCues potential to accelerate advancements in drug discovery.We have made all the source code utilized in this study publicly accessible via GitHub at http://www.healthinformaticslab.org/supp/ or https://github.com/zhangruochi/MolFeSCue. The code (MolFeSCue-v1-00) is also available as the supplementary file of this paper.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Clifford完成签到,获得积分10
刚刚
柯忻完成签到,获得积分10
1秒前
冷艳铁身完成签到,获得积分10
1秒前
豆豆发布了新的文献求助30
2秒前
2秒前
哈鲁完成签到,获得积分20
2秒前
研友_LX7478完成签到,获得积分10
3秒前
李健的小迷弟应助shennan采纳,获得10
3秒前
hh发布了新的文献求助10
3秒前
呦吼发布了新的文献求助30
3秒前
vousme完成签到 ,获得积分10
3秒前
Min完成签到 ,获得积分10
4秒前
4秒前
小顾完成签到,获得积分10
5秒前
6秒前
6秒前
情怀应助某某.采纳,获得10
7秒前
7秒前
nannan完成签到,获得积分10
7秒前
8秒前
一汪完成签到,获得积分10
9秒前
nannan发布了新的文献求助10
10秒前
小顾发布了新的文献求助10
10秒前
李健的小迷弟应助陸陵遊采纳,获得10
11秒前
11秒前
希尔发布了新的文献求助10
12秒前
bkagyin应助机灵冷风采纳,获得10
12秒前
12秒前
13秒前
朔月完成签到,获得积分10
14秒前
lsq725发布了新的文献求助30
15秒前
张一亦可完成签到,获得积分10
16秒前
Anna发布了新的文献求助10
16秒前
17秒前
17秒前
清晨发布了新的文献求助10
17秒前
陈肖楠完成签到,获得积分10
20秒前
科目三应助安静台灯采纳,获得10
20秒前
22秒前
23秒前
高分求助中
Manual of Clinical Microbiology, 4 Volume Set (ASM Books) 13th Edition 1000
Sport in der Antike 800
De arte gymnastica. The art of gymnastics 600
少脉山油柑叶的化学成分研究 530
Electronic Structure Calculations and Structure-Property Relationships on Aromatic Nitro Compounds 500
Berns Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
Stephen R. Mackinnon - Chen Hansheng: China’s Last Romantic Revolutionary (2023) 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2415730
求助须知:如何正确求助?哪些是违规求助? 2108826
关于积分的说明 5332160
捐赠科研通 1835965
什么是DOI,文献DOI怎么找? 914593
版权声明 561057
科研通“疑难数据库(出版商)”最低求助积分说明 489075