Machine Learning-Assisted QSAR Models on Contaminant Reactivity Toward Four Oxidants: Combining Small Data Sets and Knowledge Transfer

学习迁移 机器学习 数量结构-活动关系 化学 反应性(心理学) 人工智能 计算机科学 知识转移 传输(计算) 样品(材料) 训练集 分子描述符 数据挖掘 色谱法 病理 医学 并行计算 知识管理 替代医学
作者
Shifa Zhong,Yanping Zhang,Huichun Zhang
出处
期刊:Environmental Science & Technology [American Chemical Society]
卷期号:56 (1): 681-692 被引量:42
标识
DOI:10.1021/acs.est.1c04883
摘要

To develop predictive models for the reactivity of organic contaminants toward four oxidants─SO4•-, HClO, O3, and ClO2─all with small sample sizes, we proposed two approaches: combining small data sets and transferring knowledge between them. We first merged these data sets and developed a unified model using machine learning (ML), which showed better predictive performance than the individual models for HClO (RMSEtest: 2.1 to 2.04), O3 (2.06 to 1.94), ClO2 (1.77 to 1.49), and SO4•- (0.75 to 0.70) because the model "corrected" the wrongly learned effects of several atom groups. We further developed knowledge transfer models for three pairs of the data sets and observed different predictive performances: improved for O3 (RMSEtest: 2.06 to 2.01)/HClO (2.10 to 1.98), mixed for O3 (2.06 to 2.01)/ClO2 (1.77 to 1.95), and unchanged for ClO2 (1.77 to 1.77)/HClO (2.1 to 2.1). The effectiveness of the latter approach depended on whether there was consistent knowledge shared between the data sets and on the performance of the individual models. We also compared our approaches with multitask learning and image-based transfer learning and found that our approaches consistently improved the predictive performance for all data sets while the other two did not. This study demonstrated the effectiveness of combining small, similar data sets and transferring knowledge between them to improve ML model performance.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
李健应助珊珊采纳,获得10
1秒前
dt发布了新的文献求助10
2秒前
端庄不愁发布了新的文献求助10
2秒前
丘比特应助康先生采纳,获得10
2秒前
3秒前
酷波er应助王欢采纳,获得10
3秒前
飞飞飞发布了新的文献求助30
3秒前
SemiConduAG完成签到,获得积分10
4秒前
草拟大坝发布了新的文献求助10
5秒前
Nico发布了新的文献求助10
5秒前
6秒前
6秒前
7秒前
天天快乐应助马户牙采纳,获得10
7秒前
SemiConduAG发布了新的文献求助10
8秒前
ErinZhao完成签到 ,获得积分10
8秒前
leecarp发布了新的文献求助10
8秒前
儒雅的嵩发布了新的文献求助10
8秒前
8秒前
8秒前
9秒前
kkkhhh发布了新的文献求助10
10秒前
11秒前
Nico完成签到,获得积分10
11秒前
johnson7777发布了新的文献求助10
11秒前
司徒无施发布了新的文献求助30
11秒前
12秒前
英俊的铭应助cs采纳,获得10
13秒前
我是老大应助壮观以松采纳,获得10
13秒前
英姑应助青柠采纳,获得10
13秒前
shinysparrow应助初见采纳,获得20
13秒前
康先生发布了新的文献求助10
14秒前
迅速易云发布了新的文献求助10
14秒前
小离心机完成签到,获得积分10
16秒前
在水一方应助Lianna采纳,获得30
17秒前
哈哈哈完成签到,获得积分10
18秒前
咎灵阳发布了新的文献求助10
18秒前
20秒前
23完成签到,获得积分10
20秒前
高分求助中
Manual of Clinical Microbiology, 4 Volume Set (ASM Books) 13th Edition 1000
Sport in der Antike 800
De arte gymnastica. The art of gymnastics 600
Berns Ziesemer - Maos deutscher Topagent: Wie China die Bundesrepublik eroberte 500
Stephen R. Mackinnon - Chen Hansheng: China’s Last Romantic Revolutionary (2023) 500
Sport in der Antike Hardcover – March 1, 2015 500
Boris Pesce - Gli impiegati della Fiat dal 1955 al 1999 un percorso nella memoria 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2421887
求助须知:如何正确求助?哪些是违规求助? 2111532
关于积分的说明 5345089
捐赠科研通 1839030
什么是DOI,文献DOI怎么找? 915490
版权声明 561179
科研通“疑难数据库(出版商)”最低求助积分说明 489587