Robust model benchmarking and bias-imbalance in data-driven materials science: a case study on MODNet

标杆管理 计算机科学 计量经济学 数据科学 经济 管理
作者
Pierre-Paul De Breuck,Matthew L. Evans,Gian‐Marco Rignanese
出处
期刊:Journal of Physics: Condensed Matter [IOP Publishing]
卷期号:33 (40): 404002-404002 被引量:13
标识
DOI:10.1088/1361-648x/ac1280
摘要

As the number of novel data-driven approaches to material science continues to grow, it is crucial to perform consistent quality, reliability and applicability assessments of model performance.In this paper, we benchmark the Materials Optimal Descriptor Network (MODNet) method and architecture against the recently released MatBench v0.1, a curated test suite of materials datasets.MODNet is shown to outperform current leaders on 6 of the 13 tasks, whilst closely matching the current leaders on a further 2 tasks; MODNet performs particularly well when the number of samples is below 10,000.Attention is paid to two topics of concern when benchmarking models.First, we encourage the reporting of a more diverse set of metrics as it leads to a more comprehensive and holistic comparison of model performance.Second, an equally important task is the uncertainty assessment of a model towards a target domain.Significant variations in validation errors can be observed, depending on the imbalance and bias in the training set (i.e., similarity between training and application space).By using an ensemble MODNet model, confidence intervals can be built and the uncertainty on individual predictions can be quantified.Imbalance and bias issues are often overlooked, and yet are important for successful real-world applications of machine learning in materials science and condensed matter.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
1秒前
拉长的冰海完成签到 ,获得积分10
1秒前
Alice_Arendt完成签到,获得积分10
1秒前
今后应助虚幻的小海豚采纳,获得10
1秒前
星辰大海应助金启维采纳,获得10
2秒前
bjx发布了新的文献求助20
2秒前
kevinqpp发布了新的文献求助10
2秒前
3秒前
搜集达人应助无辜的惜寒采纳,获得10
3秒前
syyy完成签到,获得积分10
4秒前
六道完成签到,获得积分10
4秒前
Fu完成签到,获得积分10
5秒前
5秒前
5秒前
pinghua完成签到,获得积分10
5秒前
5秒前
6秒前
ghgbhgybh发布了新的文献求助10
7秒前
7秒前
wz发布了新的文献求助10
9秒前
赘婿应助闪电遗迹采纳,获得10
9秒前
nessa发布了新的文献求助100
9秒前
poppy发布了新的文献求助10
10秒前
leahhan完成签到 ,获得积分10
10秒前
10秒前
夏天冷完成签到,获得积分10
11秒前
wei完成签到 ,获得积分10
11秒前
宇称yu完成签到 ,获得积分10
11秒前
11秒前
研友_5Y9775发布了新的文献求助10
12秒前
Somogyis发布了新的文献求助10
15秒前
Owen应助beeyuewu采纳,获得10
15秒前
三色完成签到,获得积分10
17秒前
赵琼珍完成签到 ,获得积分10
17秒前
桐桐应助jaum采纳,获得10
18秒前
善学以致用应助上岸小熙采纳,获得10
18秒前
小小牛马应助超级盼海采纳,获得10
18秒前
Somogyis完成签到,获得积分10
20秒前
研友_VZG7GZ应助errui采纳,获得10
20秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Kinesiophobia : a new view of chronic pain behavior 2000
Research for Social Workers 1000
Psychology and Work Today 800
Mastering New Drug Applications: A Step-by-Step Guide (Mastering the FDA Approval Process Book 1) 800
Signals, Systems, and Signal Processing 510
Discrete-Time Signals and Systems 510
热门求助领域 (近24小时)
化学 材料科学 生物 医学 工程类 计算机科学 有机化学 物理 生物化学 纳米技术 复合材料 内科学 化学工程 人工智能 催化作用 遗传学 数学 基因 量子力学 物理化学
热门帖子
关注 科研通微信公众号,转发送积分 5899286
求助须知:如何正确求助?哪些是违规求助? 6728013
关于积分的说明 15742945
捐赠科研通 5021715
什么是DOI,文献DOI怎么找? 2704323
邀请新用户注册赠送积分活动 1651459
关于科研通互助平台的介绍 1599450