清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

BFGTP: A BERT-Guided Two-Stage Molecular Representation Learning Framework for Toxicity Prediction

计算机科学 代表(政治) 人工智能 阶段(地层学) 机器学习 生物 古生物学 政治 政治学 法学
作者
Keqiang Hu,Yuan He,Jianguo Wei,Changming Sun,Jie Geng,Leyi Wei,Ran Su
出处
期刊:IEEE Journal of Biomedical and Health Informatics [Institute of Electrical and Electronics Engineers]
卷期号:: 1-11
标识
DOI:10.1109/jbhi.2025.3556766
摘要

Accurate prediction of molecular toxicity is vital for drug development. Most mainstream methods rely on fingerprints or graph-based feature extraction, the emergence of large language models (LLMs) offers new prospects for molecular representation learning in toxicity prediction. Although several studies attempt to leverage LLMs to integrate molecular sequence data for pretraining molecular representations, certain limitations remain. Current LLM-based approaches usually utilize solely on class embedding features, overlooking the rich information in sequence embedding. Moreover, integrating pre-trained molecular representations with multi-modal molecular data may further enhance performance in toxicity prediction. To address these challenges, we propose BFGTP, a BERT-guided two-stage molecular representation learning framework for toxicity prediction. Firstly, we design independent encoders for molecular descriptions of three modalities, where the fingerprint encoder with dual level attention mechanisms effectively integrates multi-category fingerprints. Then, the two-stage guide strategy is introduced to fully utilize the prior knowledge of LLMs, employing contrastive learning to align and fuse the tri-modal representations and knowledge distillation to align predicted value distributions. BFGTP ultimately combines fingerprint and graph representations to predict molecular toxicity. Experiments on seven toxicity datasets show that BFGTP outperforms baselines, achieving the highest AUC on five datasets and the best average performance across five evaluation metrics. Ablation studies, t-SNE visualization and case study confirm the effectiveness of BFGTP's components and its ability to capture meaningful molecular representations.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
17秒前
wangfaqing942完成签到 ,获得积分10
29秒前
遗迹小白完成签到,获得积分10
31秒前
笨笨完成签到 ,获得积分10
49秒前
hmhu发布了新的文献求助10
54秒前
研友_nvG5bZ发布了新的文献求助10
58秒前
treat4869发布了新的文献求助10
1分钟前
1分钟前
满意白卉完成签到 ,获得积分10
1分钟前
poki完成签到 ,获得积分10
1分钟前
1分钟前
景代丝完成签到,获得积分0
1分钟前
余额不足完成签到,获得积分20
1分钟前
1分钟前
打打应助科研通管家采纳,获得10
1分钟前
wanci应助余额不足采纳,获得10
1分钟前
2分钟前
魁梧的诗柳应助紫熊采纳,获得10
2分钟前
Yafeiyy___完成签到,获得积分10
2分钟前
2分钟前
研友_nvG5bZ发布了新的文献求助30
2分钟前
jlwang完成签到,获得积分10
2分钟前
邱佩群完成签到 ,获得积分10
2分钟前
小土豆完成签到,获得积分10
2分钟前
科研的豪哥完成签到 ,获得积分10
2分钟前
2分钟前
kaier完成签到 ,获得积分10
2分钟前
Stephhen完成签到,获得积分10
2分钟前
study完成签到,获得积分10
2分钟前
2分钟前
treat4869完成签到 ,获得积分10
3分钟前
研友_nvG5bZ发布了新的文献求助10
3分钟前
3分钟前
摩卡应助紫熊采纳,获得10
3分钟前
3分钟前
3分钟前
fogsea完成签到,获得积分0
4分钟前
紫熊完成签到,获得积分10
4分钟前
4分钟前
高分求助中
(应助此贴封号)【重要!!请各位详细阅读】【科研通的精品贴汇总】 10000
F-35B V2.0 How to build Kitty Hawk's F-35B Version 2.0 Model 2000
中国兽药产业发展报告 1000
Biodegradable Embolic Microspheres Market Insights 888
Quantum reference frames : from quantum information to spacetime 888
Pediatric Injectable Drugs 500
2025-2031全球及中国蛋黄lgY抗体行业研究及十五五规划分析报告(2025-2031 Global and China Chicken lgY Antibody Industry Research and 15th Five Year Plan Analysis Report) 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4444850
求助须知:如何正确求助?哪些是违规求助? 3915294
关于积分的说明 12155624
捐赠科研通 3564127
什么是DOI,文献DOI怎么找? 1956841
邀请新用户注册赠送积分活动 996410
科研通“疑难数据库(出版商)”最低求助积分说明 891677