SNAr Regioselectivity Predictions: Machine Learning Triggering DFT Reaction Modeling through Statistical Threshold

区域选择性 计算机科学 工作流程 密度泛函理论 化学 计算化学 催化作用 数据库 有机化学
作者
Yanfei Guan,Taegyo Lee,Ke Wang,Shu Yu,J. Christopher McWilliams
出处
期刊:Journal of Chemical Information and Modeling [American Chemical Society]
卷期号:63 (12): 3751-3760 被引量:9
标识
DOI:10.1021/acs.jcim.3c00580
摘要

Fast and accurate prospective predictions of regioselectivity can significantly reduce the time and resources spent on unproductive transformations in the pharmaceutical industry. Density functional theory (DFT) reaction modeling through transition state theory (TST) and machine learning (ML) methods has been widely used to predict reaction outcomes such as selectivity. However, TST reaction modeling and ML methods are either time-consuming or data-dependent. Herein, we introduce a prototype seamlessly bridging ML and TST modeling by triggering resource-intensive but much less domain-sensitive DFT calculations only on less confident ML predictions. The proposed workflow was trained and tested on both the Pfizer internal dataset and the USPTO public dataset to predict regioselectivity for SNAr reactions. Our method is accurate and fast, which achieves 96.3 and 94.7% accuracy in predicting the correct major product on Pfizer and USPTO datasets, respectively, in a fraction of conventional TST computing time.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
NexusExplorer应助Yamal采纳,获得10
2秒前
Jocelyn发布了新的文献求助30
3秒前
3秒前
倩倩发布了新的文献求助10
4秒前
深情安青应助怡然晓兰采纳,获得10
4秒前
布吉岛完成签到,获得积分20
5秒前
FashionBoy应助热闹的冬天采纳,获得10
5秒前
领导范儿应助热闹的冬天采纳,获得10
5秒前
愉快惜寒发布了新的文献求助10
6秒前
科研通AI2S应助热闹的冬天采纳,获得10
6秒前
小松鼠完成签到,获得积分10
6秒前
科研通AI2S应助热闹的冬天采纳,获得10
6秒前
英姑应助热闹的冬天采纳,获得10
6秒前
北风完成签到,获得积分10
6秒前
隐形曼青应助热闹的冬天采纳,获得10
6秒前
乐乐应助热闹的冬天采纳,获得10
6秒前
小蘑菇应助热闹的冬天采纳,获得10
6秒前
852应助热闹的冬天采纳,获得10
6秒前
科研通AI2S应助热闹的冬天采纳,获得10
7秒前
8秒前
Sandm发布了新的文献求助10
8秒前
孢子完成签到,获得积分10
9秒前
9秒前
9秒前
Conan发布了新的文献求助10
9秒前
小小鱼完成签到,获得积分20
10秒前
11秒前
12秒前
12秒前
梨花雨凉完成签到,获得积分10
12秒前
orixero应助玉堂堂采纳,获得10
13秒前
13秒前
ZZXX发布了新的文献求助10
13秒前
科研小白完成签到,获得积分10
15秒前
SciGPT应助不说再见采纳,获得10
15秒前
16秒前
tantan完成签到,获得积分10
16秒前
BonnieO完成签到,获得积分10
16秒前
隐形曼青应助nightgaunt采纳,获得10
18秒前
归尘发布了新的文献求助30
18秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
The formation of Australian attitudes towards China, 1918-1941 640
Signals, Systems, and Signal Processing 610
全相对论原子结构与含时波包动力学的理论研究--清华大学 500
Elevating Next Generation Genomic Science and Technology using Machine Learning in the Healthcare Industry Applied Machine Learning for IoT and Data Analytics 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6443372
求助须知:如何正确求助?哪些是违规求助? 8257256
关于积分的说明 17586014
捐赠科研通 5501953
什么是DOI,文献DOI怎么找? 2900861
邀请新用户注册赠送积分活动 1877922
关于科研通互助平台的介绍 1717521