Retention Time Prediction through Learning from a Small Training Data Set with a Pretrained Graph Neural Network

杠杆(统计) 学习迁移 计算机科学 训练集 机器学习 人工智能 标记数据 人工神经网络 一般化 图形 数据集 集合(抽象数据类型) 理论计算机科学 数学 数学分析 程序设计语言
作者
Youngchun Kwon,Hyukju Kwon,Jongmin Han,Myeonginn Kang,Ji‐Yeong Kim,Dongyeeb Shin,Youn-Suk Choi,Seokho Kang
出处
期刊:Analytical Chemistry [American Chemical Society]
卷期号:95 (47): 17273-17283 被引量:1
标识
DOI:10.1021/acs.analchem.3c03177
摘要

Graph neural networks (GNNs) have shown remarkable performance in predicting the retention time (RT) for small molecules. However, the training data set for a particular target chromatographic system tends to exhibit scarcity, which poses a challenge because the experimental process for measuring RT is costly. To address this challenge, transfer learning has been used to leverage an abundant training data set from a related source task. In this study, we present an improved transfer learning method to better predict the RT of molecules for a target chromatographic system by learning from a small training data set with a pretrained GNN. We use a graph isomorphism network as the architecture of the GNN. The GNN is pretrained on the METLIN-SMRT data set and is then fine-tuned on the target training data set for a fixed number of training iterations using the limited-memory Broyden-Fletcher-Goldfarb-Shanno optimizer with a learning rate decay. We demonstrate that the proposed method achieves superior predictive performance on various chromatographic systems compared with that of the existing transfer learning methods, especially when only a small training data set is available for use. A potential avenue for future research is to leverage multiple small training data sets from different chromatographic systems to further enhance the generalization performance.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
林牧完成签到,获得积分10
2秒前
2秒前
慢慢完成签到 ,获得积分10
2秒前
feier完成签到,获得积分10
3秒前
谦让的含海应助稳重玥玥采纳,获得20
4秒前
Richard完成签到 ,获得积分10
4秒前
帅哥吴克完成签到,获得积分10
4秒前
Copyright应助研友_LMBAXn采纳,获得10
4秒前
4秒前
多喝水完成签到 ,获得积分10
5秒前
Tbo完成签到,获得积分10
5秒前
幸运娃娃完成签到 ,获得积分10
6秒前
magic7完成签到,获得积分10
6秒前
suoluotree完成签到,获得积分10
6秒前
AidenZhang发布了新的文献求助10
6秒前
Shydaworst完成签到,获得积分10
6秒前
呆萌的书桃完成签到,获得积分10
6秒前
T_MC郭完成签到,获得积分10
7秒前
云来如梦完成签到,获得积分10
7秒前
keyanlv完成签到,获得积分10
7秒前
王心心完成签到 ,获得积分10
7秒前
nicky完成签到 ,获得积分10
7秒前
LKX完成签到,获得积分10
8秒前
闪电霸王龙完成签到,获得积分10
8秒前
诺与控完成签到,获得积分10
9秒前
lili完成签到,获得积分10
9秒前
大东完成签到,获得积分10
11秒前
和谐的万宝路完成签到,获得积分10
11秒前
有点意思完成签到,获得积分10
11秒前
稳重玥玥完成签到,获得积分10
12秒前
无限的含羞草完成签到,获得积分10
13秒前
华仔应助Realone采纳,获得10
14秒前
xianle完成签到,获得积分10
15秒前
华华华完成签到,获得积分10
15秒前
Electrocatalysis完成签到,获得积分10
16秒前
wenbo完成签到,获得积分10
17秒前
白露完成签到 ,获得积分10
18秒前
活力的映易完成签到,获得积分10
18秒前
帅气蓝完成签到,获得积分10
19秒前
高分求助中
Annie Ernaux: De la perte au corps glorieux 600
Petrology and Plate Tectonics,2025 500
Optical Coating Design with the Essential Macleod 400
A revision of Limenitis helmanni and its related species (Nymphalidae) from Central and South China 400
Moore's Clinically Oriented Anatomy 10th Edition 400
Direct and Iterative Linear System Solvers 400
Cardiopulmonary Bypass and Mechanical Support: Principles and Practice, Fifth Edition 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6783193
求助须知:如何正确求助?哪些是违规求助? 8505453
关于积分的说明 18113397
捐赠科研通 6087301
什么是DOI,文献DOI怎么找? 3019248
邀请新用户注册赠送积分活动 1996197
关于科研通互助平台的介绍 1981538