Conditional Molecular Generation Net Enables Automated Structure Elucidation Based on 13C NMR Spectra and Prior Knowledge

化学 碳-13核磁共振 核磁共振谱数据库 分子模型 粒度 生物系统 谱线 计算机科学 立体化学 物理 操作系统 天文 生物
作者
Lin Yao,Minjian Yang,Jianfei Song,Zhuo Yang,Hanyu Sun,Hui Shi,Xue Liu,Xiangyang Ji,Yafeng Deng,Xiaojian Wang
出处
期刊:Analytical Chemistry [American Chemical Society]
卷期号:95 (12): 5393-5401 被引量:16
标识
DOI:10.1021/acs.analchem.2c05817
摘要

Structure elucidation of unknown compounds based on nuclear magnetic resonance (NMR) remains a challenging problem in both synthetic organic and natural product chemistry. Library matching has been an efficient method to assist structure elucidation. However, it is limited by the coverage of libraries. In addition, prior knowledge such as molecular fragments is neglected. To solve the problem, we propose a conditional molecular generation net (CMGNet) to allow input of multiple sources of information. CMGNet not only uses 13C NMR spectrum data as input but molecular formulas and fragments of molecules are also employed as input conditions. Our model applies large-scale pretraining for molecular understanding and fine-tuning on two NMR spectral data sets of different granularity levels to accommodate structure elucidation tasks. CMGNet generates structures based on 13C NMR data, molecular formula, and fragment information, with a recovery rate of 94.17% in the top 10 recommendations. In addition, the generative model performed well in the generation of various classes of compounds and in the structural revision task. CMGNet has a deep understanding of molecular connectivities from 13C NMR, molecular formula, and fragments, paving the way for a new paradigm of deep learning-assisted inverse problem-solving.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
buguashushu完成签到,获得积分10
1秒前
Adhklu完成签到 ,获得积分10
1秒前
1秒前
牛幻香完成签到,获得积分10
2秒前
默末发布了新的文献求助10
2秒前
xuxingxing完成签到,获得积分10
2秒前
xixi789完成签到,获得积分10
5秒前
走着走着就散了完成签到,获得积分10
5秒前
JamesPei应助小猫咪采纳,获得10
5秒前
Summer完成签到,获得积分10
5秒前
7秒前
量子星尘发布了新的文献求助10
8秒前
666发布了新的文献求助10
8秒前
赖雅绿发布了新的文献求助10
8秒前
9秒前
苏坡men发布了新的社区帖子
9秒前
11秒前
666完成签到 ,获得积分10
12秒前
Ming完成签到,获得积分10
12秒前
15秒前
默默芝麻发布了新的文献求助10
15秒前
zh发布了新的文献求助10
18秒前
直击灵魂完成签到 ,获得积分10
18秒前
柔弱金毛发布了新的文献求助10
19秒前
小马甲应助peng采纳,获得10
19秒前
19秒前
春鸮鸟完成签到 ,获得积分10
21秒前
虞曦关注了科研通微信公众号
23秒前
J_ust22完成签到 ,获得积分10
23秒前
林北是派大星完成签到,获得积分10
26秒前
zh发布了新的文献求助30
26秒前
J_ust22关注了科研通微信公众号
27秒前
28秒前
y13333完成签到,获得积分10
28秒前
CC完成签到,获得积分10
32秒前
33秒前
兰月满楼发布了新的文献求助10
33秒前
35秒前
666发布了新的文献求助10
37秒前
37秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Zur lokalen Geoidbestimmung aus terrestrischen Messungen vertikaler Schweregradienten 1000
Schifanoia : notizie dell'istituto di studi rinascimentali di Ferrara : 66/67, 1/2, 2024 1000
Circulating tumor DNA from blood and cerebrospinal fluid in DLBCL: simultaneous evaluation of mutations, IG rearrangement, and IG clonality 500
Food Microbiology - An Introduction (5th Edition) 500
Architectural Corrosion and Critical Infrastructure 400
Bacillus subtilis and Other Gram‐Positive Bacteria: Biochemistry, Physiology, and Molecular Genetics 400
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4853409
求助须知:如何正确求助?哪些是违规求助? 4151258
关于积分的说明 12861177
捐赠科研通 3900258
什么是DOI,文献DOI怎么找? 2143148
邀请新用户注册赠送积分活动 1162914
关于科研通互助平台的介绍 1063338