A Large-scale Synthetic Pathological Dataset for Deep Learning-enabled Segmentation of Breast Cancer

计算机科学 人工智能 分割 乳腺癌 深度学习 比例(比率) 癌症 模式识别(心理学) 地图学 地理 医学 内科学
作者
Kexin Ding,Mu Zhou,He Wang,Olivier Gevaert,Dimitris Metaxas,Shaoting Zhang
出处
期刊:Scientific Data [Nature Portfolio]
卷期号:10 (1) 被引量:35
标识
DOI:10.1038/s41597-023-02125-y
摘要

Abstract The success of training computer-vision models heavily relies on the support of large-scale, real-world images with annotations. Yet such an annotation-ready dataset is difficult to curate in pathology due to the privacy protection and excessive annotation burden. To aid in computational pathology, synthetic data generation, curation, and annotation present a cost-effective means to quickly enable data diversity that is required to boost model performance at different stages. In this study, we introduce a large-scale synthetic pathological image dataset paired with the annotation for nuclei semantic segmentation, termed as Synthetic Nuclei and annOtation Wizard (SNOW). The proposed SNOW is developed via a standardized workflow by applying the off-the-shelf image generator and nuclei annotator. The dataset contains overall 20k image tiles and 1,448,522 annotated nuclei with the CC-BY license. We show that SNOW can be used in both supervised and semi-supervised training scenarios. Extensive results suggest that synthetic-data-trained models are competitive under a variety of model training settings, expanding the scope of better using synthetic images for enhancing downstream data-driven clinical tasks.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
英俊的铭应助杨杨采纳,获得10
1秒前
tyccc发布了新的文献求助10
2秒前
孙佳慧发布了新的文献求助10
3秒前
Mason发布了新的文献求助10
4秒前
PositiveJugend完成签到,获得积分10
5秒前
5秒前
5秒前
Pineapple完成签到,获得积分10
5秒前
9527完成签到,获得积分10
8秒前
闪闪可乐发布了新的文献求助10
9秒前
酷波er应助孙佳慧采纳,获得10
10秒前
小萝莉完成签到,获得积分10
17秒前
JamesPei应助钱多多采纳,获得10
17秒前
AAAADiao完成签到 ,获得积分10
18秒前
19秒前
飞乐扣完成签到 ,获得积分10
19秒前
21秒前
zzz完成签到,获得积分10
22秒前
科研通AI5应助坐以待毕采纳,获得10
22秒前
22秒前
yang完成签到 ,获得积分10
24秒前
25秒前
Alnair完成签到,获得积分10
25秒前
26秒前
haishixigua完成签到,获得积分10
27秒前
Brian完成签到,获得积分10
27秒前
杨杨发布了新的文献求助10
27秒前
咔嚓一下发布了新的文献求助10
28秒前
29秒前
钱多多发布了新的文献求助10
30秒前
高高代珊完成签到 ,获得积分10
30秒前
Yang完成签到,获得积分10
30秒前
爆米花应助形随将至采纳,获得10
31秒前
spzdss发布了新的文献求助10
34秒前
兮云发布了新的文献求助10
34秒前
yyyyyy发布了新的文献求助10
38秒前
FashionBoy应助小羊采纳,获得10
38秒前
兮云完成签到,获得积分10
41秒前
42秒前
高分求助中
Thinking Small and Large 500
Algorithmic Mathematics in Machine Learning 500
Getting Published in SSCI Journals: 200+ Questions and Answers for Absolute Beginners 300
Preparative Methods of Polymer Chemistry, 3rd Edition 200
The Oxford Handbook of Chinese Philosophy 200
New Syntheses with Carbon Monoxide 200
Quanterion Automated Databook NPRD-2023 200
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3834960
求助须知:如何正确求助?哪些是违规求助? 3377456
关于积分的说明 10498597
捐赠科研通 3096925
什么是DOI,文献DOI怎么找? 1705320
邀请新用户注册赠送积分活动 820529
科研通“疑难数据库(出版商)”最低求助积分说明 772110