Optimized De Novo Molecular Generation (OMG) for Mass Spectra Annotation Using Transfer and Reinforcement Learning

注释 计算机科学 强化学习 排名(信息检索) 生成模型 化学 人工智能 公共化学 生成语法 生物化学
作者
Margaret R. Martin,Soha Hassoun
出处
期刊:Analytical Chemistry [American Chemical Society]
标识
DOI:10.1021/acs.analchem.5c01770
摘要

Despite the size increase in spectral reference libraries and available annotation tools, the rate of assigning molecular structures to tandem mass spectra remains low. As not all chemical products are known nor cataloged in databases, generative AI models are poised to address this gap through de novo structural candidate generation. We develop a novel method, Optimized Molecular Generation (OMG), for de novo molecular generation for mass spectra annotation. OMG comprises two steps: molecular generation and candidate ranking. During molecular generation, we finetune a prior unbiased molecular generation model using transfer learning on molecules retrieved from PubChem based on a target molecular formula. Using reinforcement learning, we utilize custom scoring functions to create a curriculum-learning scheme that guides the generation of novel molecular candidates for a queried spectrum. After sampling the finetuned model, we rank the generated candidate structures. OMG finetunes REINVENT4's pretrained molecular generator and ranks generated molecules using two recent ranking models, JESTR and ESP. We evaluate OMG on the CANOPUS and MassSpecGym data sets, for which OMG achieves 10.51 and 2.42% for top-1 accuracy, respectively, therefore outperforming current baselines. Our work highlights the promise of utilizing transfer and reinforcement learning in guiding de novo generation for spectra annotation.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
2秒前
wangy完成签到,获得积分10
4秒前
枣树先生发布了新的文献求助10
4秒前
4秒前
5秒前
科研微微发布了新的文献求助10
6秒前
ZZH完成签到,获得积分10
6秒前
一杯沧海完成签到 ,获得积分10
6秒前
8秒前
ZSH驳回了bkagyin应助
8秒前
鳗鱼如松完成签到,获得积分10
8秒前
ausb给ausb的求助进行了留言
8秒前
vera发布了新的文献求助10
11秒前
复杂惜霜完成签到,获得积分20
15秒前
自由蓉完成签到,获得积分10
16秒前
gfreezer发布了新的文献求助10
17秒前
科研通AI5应助科研通管家采纳,获得10
17秒前
镓氧锌钇铀举报Y30240812求助涉嫌违规
17秒前
科研通AI5应助科研通管家采纳,获得10
17秒前
汉堡包应助科研通管家采纳,获得10
17秒前
852应助科研通管家采纳,获得10
17秒前
18秒前
浮游应助科研通管家采纳,获得10
18秒前
小马甲应助科研微微采纳,获得10
18秒前
子车茗应助科研通管家采纳,获得30
18秒前
Lucas应助科研通管家采纳,获得10
18秒前
酷波er应助科研通管家采纳,获得10
19秒前
科研通AI5应助科研通管家采纳,获得10
19秒前
田様应助科研通管家采纳,获得10
19秒前
klyang应助科研通管家采纳,获得20
19秒前
CipherSage应助科研通管家采纳,获得10
19秒前
老阎应助科研通管家采纳,获得30
19秒前
小马甲应助科研通管家采纳,获得30
19秒前
爱吃棒棒糖的猫完成签到,获得积分10
22秒前
22秒前
疯狂的丹珍完成签到 ,获得积分10
24秒前
模拟洗涤剂完成签到 ,获得积分10
26秒前
27秒前
Hello应助洛希采纳,获得10
27秒前
高分求助中
Pipeline and riser loss of containment 2001 - 2020 (PARLOC 2020) 1000
哈工大泛函分析教案课件、“72小时速成泛函分析:从入门到入土.PDF”等 660
Comparing natural with chemical additive production 500
The Leucovorin Guide for Parents: Understanding Autism’s Folate 500
Phylogenetic study of the order Polydesmida (Myriapoda: Diplopoda) 500
A Manual for the Identification of Plant Seeds and Fruits : Second revised edition 500
The Social Work Ethics Casebook: Cases and Commentary (revised 2nd ed.) 400
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 5207577
求助须知:如何正确求助?哪些是违规求助? 4385457
关于积分的说明 13656909
捐赠科研通 4244029
什么是DOI,文献DOI怎么找? 2328560
邀请新用户注册赠送积分活动 1326245
关于科研通互助平台的介绍 1278450