Conditional Molecular Generation Net Enables Automated Structure Elucidation Based on 13C NMR Spectra and Prior Knowledge

化学 碳-13核磁共振 核磁共振谱数据库 分子模型 粒度 生物系统 谱线 计算机科学 立体化学 物理 操作系统 天文 生物
作者
Lin Yao,Minjian Yang,Jianfei Song,Zhuo Yang,Hanyu Sun,Hui Shi,Xue Liu,Xiangyang Ji,Yafeng Deng,Xiaojian Wang
出处
期刊:Analytical Chemistry [American Chemical Society]
卷期号:95 (12): 5393-5401 被引量:13
标识
DOI:10.1021/acs.analchem.2c05817
摘要

Structure elucidation of unknown compounds based on nuclear magnetic resonance (NMR) remains a challenging problem in both synthetic organic and natural product chemistry. Library matching has been an efficient method to assist structure elucidation. However, it is limited by the coverage of libraries. In addition, prior knowledge such as molecular fragments is neglected. To solve the problem, we propose a conditional molecular generation net (CMGNet) to allow input of multiple sources of information. CMGNet not only uses 13C NMR spectrum data as input but molecular formulas and fragments of molecules are also employed as input conditions. Our model applies large-scale pretraining for molecular understanding and fine-tuning on two NMR spectral data sets of different granularity levels to accommodate structure elucidation tasks. CMGNet generates structures based on 13C NMR data, molecular formula, and fragment information, with a recovery rate of 94.17% in the top 10 recommendations. In addition, the generative model performed well in the generation of various classes of compounds and in the structural revision task. CMGNet has a deep understanding of molecular connectivities from 13C NMR, molecular formula, and fragments, paving the way for a new paradigm of deep learning-assisted inverse problem-solving.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
rye227应助看不见的哇塞采纳,获得10
2秒前
咸鱼完成签到,获得积分10
3秒前
科研通AI5应助张张采纳,获得10
4秒前
月亮发布了新的文献求助10
4秒前
大模型应助安详草莓采纳,获得30
5秒前
6秒前
6秒前
丰富的小甜瓜完成签到,获得积分10
6秒前
10秒前
QR发布了新的文献求助10
10秒前
寂寞的威完成签到,获得积分10
12秒前
未改完成签到,获得积分10
12秒前
meatball1982完成签到,获得积分10
13秒前
16秒前
完美世界应助皮皮采纳,获得10
16秒前
wuw发布了新的文献求助10
19秒前
21秒前
Charley完成签到,获得积分20
22秒前
24秒前
26秒前
Charley发布了新的文献求助10
26秒前
追寻茗发布了新的文献求助10
27秒前
29秒前
愫浅完成签到 ,获得积分10
29秒前
夏一苒完成签到,获得积分20
30秒前
科研通AI5应助张张采纳,获得10
32秒前
34秒前
Leslie完成签到,获得积分10
38秒前
38秒前
谦让的西装完成签到 ,获得积分10
39秒前
39秒前
追寻茗完成签到,获得积分10
40秒前
wy1693207859完成签到,获得积分10
41秒前
haipronl发布了新的文献求助10
41秒前
gry发布了新的文献求助10
44秒前
gry完成签到,获得积分10
50秒前
科研通AI5应助yanier采纳,获得10
50秒前
失眠的板栗完成签到,获得积分10
51秒前
51秒前
52秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
Maneuvering of a Damaged Navy Combatant 650
Mixing the elements of mass customisation 300
the MD Anderson Surgical Oncology Manual, Seventh Edition 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3778047
求助须知:如何正确求助?哪些是违规求助? 3323723
关于积分的说明 10215564
捐赠科研通 3038918
什么是DOI,文献DOI怎么找? 1667711
邀请新用户注册赠送积分活动 798351
科研通“疑难数据库(出版商)”最低求助积分说明 758339