Prediction and Structure–Activity Relationship Analysis on Ready Biodegradability of Chemical Using Machine Learning Method

生物降解 随机森林 数量结构-活动关系 化学 氢键 支持向量机 溶解度 人工智能 试验装置 相关系数 适用范围 分子描述符 机器学习 分子 生物系统 计算机科学 有机化学 生物
作者
Hongyan Yin,Cheng Ting Lin,Yujia Tian,Aixia Yan
出处
期刊:Chemical Research in Toxicology [American Chemical Society]
卷期号:36 (4): 617-629 被引量:3
标识
DOI:10.1021/acs.chemrestox.2c00330
摘要

Persistent contaminants from different industries have already caused significant risks to the environment and public health. In this study, a data set containing 1306 not readily biodegradable (NRB) and 622 readily biodegradable (RB) chemicals was collected and characterized by CORINA descriptors, MACCS fingerprints, and ECFP_4 fingerprints. We utilized decision tree (DT), support vector machine (SVM), random forest (RF), and deep neural network (DNN) to construct 34 classification models that could predict the biodegradability of compounds. The best model (model 5F) built using a Transformer-CNN algorithm had a balanced accuracy of 86.29% and a Matthews correlation coefficient of 0.71 on the test set. By analyzing the top 10 CORINA descriptors used for modeling, the properties containing solubility, π/σ atom charges, rotatable bonds number, lone pair/π/σ atom electronegativities, molecular weight, and number of nitrogen atom based hydrogen bonding acceptors were determined to be critical for biodegradability. The substructure investigations confirmed earlier studies that the presence of aromatic rings and nitrogen or halogen substitutions in a molecule will hinder the biodegradation of the compound, while the ester groups and carboxyl groups promote biodegradability. We also identified the representative fragments affecting biodegradability by analyzing the frequency differences of substructural fragments between the NRB and RB compounds. The results of the study can provide excellent guidance for the discovery and design of compounds with good chemical biodegradability.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
ai白哥完成签到,获得积分10
刚刚
喜悦香薇完成签到,获得积分10
刚刚
xiaostou完成签到,获得积分10
1秒前
2秒前
ponytail完成签到 ,获得积分10
2秒前
鱼在哪儿发布了新的文献求助10
4秒前
liv应助一个小胖子采纳,获得10
4秒前
课呢完成签到,获得积分10
6秒前
mojomars发布了新的文献求助10
7秒前
8秒前
无花果应助科研通管家采纳,获得10
9秒前
浮尘完成签到 ,获得积分0
9秒前
深情安青应助科研通管家采纳,获得10
9秒前
田様应助科研通管家采纳,获得10
9秒前
9秒前
Hello应助科研通管家采纳,获得10
9秒前
9秒前
FashionBoy应助科研通管家采纳,获得10
9秒前
yutustd完成签到,获得积分10
9秒前
小尹同学应助科研通管家采纳,获得30
9秒前
竹羽完成签到 ,获得积分0
10秒前
科目三应助waterloooo采纳,获得10
11秒前
星辰大海应助youan采纳,获得10
14秒前
研友_LkDm3n发布了新的文献求助10
14秒前
14秒前
憨小郁完成签到,获得积分10
15秒前
褚友菱完成签到 ,获得积分10
18秒前
bkagyin应助kiri采纳,获得10
20秒前
新肺模型完成签到,获得积分10
20秒前
gjww应助宝宝巴士驾驶员采纳,获得10
20秒前
LMY1411完成签到,获得积分10
20秒前
GAOGONGZI完成签到,获得积分10
22秒前
桃子完成签到,获得积分10
22秒前
就想接接接一篇完成签到,获得积分10
23秒前
张困困完成签到,获得积分10
25秒前
鱼在哪儿完成签到 ,获得积分10
25秒前
25秒前
秋秋子完成签到,获得积分10
26秒前
乐乐应助yiyi采纳,获得10
26秒前
绿兔子完成签到,获得积分10
26秒前
高分求助中
The three stars each: the Astrolabes and related texts 1100
Sport in der Antike 800
De arte gymnastica. The art of gymnastics 600
Berns Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
Stephen R. Mackinnon - Chen Hansheng: China’s Last Romantic Revolutionary (2023) 500
Sport in der Antike Hardcover – March 1, 2015 500
Psychological Warfare Operations at Lower Echelons in the Eighth Army, July 1952 – July 1953 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2431299
求助须知:如何正确求助?哪些是违规求助? 2114757
关于积分的说明 5362672
捐赠科研通 1842622
什么是DOI,文献DOI怎么找? 917055
版权声明 561539
科研通“疑难数据库(出版商)”最低求助积分说明 490548