Evaluation guidelines for machine learning tools in the chemical sciences

工作流程 计算机科学 可靠性 透明度(行为) 数据科学 相关性(法律) 检查表 人工智能 完备性(序理论) 管理科学 心理学 认识论 工程类 数学 政治学 哲学 计算机安全 数据库 法学 认知心理学 数学分析
作者
Andreas Bender,Nadine Schneider,Marwin Segler,W. Patrick Walters,Ola Engkvist,Tiago Rodrigues
出处
期刊:Nature Reviews Chemistry [Nature Portfolio]
卷期号:6 (6): 428-442 被引量:136
标识
DOI:10.1038/s41570-022-00391-9
摘要

Machine learning (ML) promises to tackle the grand challenges in chemistry and speed up the generation, improvement and/or ordering of research hypotheses. Despite the overarching applicability of ML workflows, one usually finds diverse evaluation study designs. The current heterogeneity in evaluation techniques and metrics leads to difficulty in (or the impossibility of) comparing and assessing the relevance of new algorithms. Ultimately, this may delay the digitalization of chemistry at scale and confuse method developers, experimentalists, reviewers and journal editors. In this Perspective, we critically discuss a set of method development and evaluation guidelines for different types of ML-based publications, emphasizing supervised learning. We provide a diverse collection of examples from various authors and disciplines in chemistry. While taking into account varying accessibility across research groups, our recommendations focus on reporting completeness and standardizing comparisons between tools. We aim to further contribute to improved ML transparency and credibility by suggesting a checklist of retro-/prospective tests and dissecting their importance. We envisage that the wide adoption and continuous update of best practices will encourage an informed use of ML on real-world problems related to the chemical sciences.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
六六发布了新的文献求助30
1秒前
Eric完成签到,获得积分10
2秒前
泥嚎完成签到,获得积分10
6秒前
顺儿完成签到,获得积分10
8秒前
香蕉新儿完成签到,获得积分10
11秒前
13秒前
淡然完成签到 ,获得积分10
13秒前
xinjie完成签到,获得积分10
14秒前
左安完成签到,获得积分10
14秒前
cheng发布了新的文献求助10
20秒前
孤独乐瑶发布了新的文献求助10
20秒前
zcw完成签到 ,获得积分10
21秒前
健康乐悠悠完成签到 ,获得积分10
22秒前
王哇噻完成签到 ,获得积分10
22秒前
25秒前
飞龙在天完成签到,获得积分0
26秒前
cdercder应助科研通管家采纳,获得10
28秒前
28秒前
cdercder应助科研通管家采纳,获得10
28秒前
酷波er应助科研通管家采纳,获得10
28秒前
cdercder应助科研通管家采纳,获得10
28秒前
电池博士发布了新的文献求助10
29秒前
LHY关闭了LHY文献求助
32秒前
CQ完成签到 ,获得积分10
38秒前
lichunrong完成签到,获得积分10
38秒前
望向天空的鱼完成签到 ,获得积分10
43秒前
48秒前
50秒前
糖糖完成签到 ,获得积分10
50秒前
victory_liu发布了新的文献求助10
50秒前
maomao完成签到 ,获得积分10
52秒前
cheng发布了新的文献求助10
55秒前
1分钟前
杨三完成签到 ,获得积分10
1分钟前
1分钟前
谢大喵完成签到,获得积分10
1分钟前
小耳朵完成签到 ,获得积分10
1分钟前
CY完成签到,获得积分10
1分钟前
谢大喵发布了新的文献求助30
1分钟前
儒飞完成签到,获得积分10
1分钟前
高分求助中
Adhesion Science: Principles & Practice 1234
Signals, Systems, and Signal Processing 610
Burger's Medicinal Chemistry and Drug Discovery 400
A Step-by-Step Guide to Qualitative Data Coding 2nd Edition 400
Impact of Storage Orientation and Duration on Prefilled Syringe Performance: Break-Loose and Glide Forces, and Injection Time Across Multiple Time Points 360
Programming for Chemical Engineers Using C, C++, and MATLAB 300
Upland Kenya wild flowers and ferns: a flora of the flowers, ferns, grasses, and sedges of highland Kenya 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6662938
求助须知:如何正确求助?哪些是违规求助? 8413037
关于积分的说明 17984348
捐赠科研通 5866763
什么是DOI,文献DOI怎么找? 2974939
邀请新用户注册赠送积分活动 1950845
关于科研通互助平台的介绍 1876490