清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Automated real-world data integration improves cancer outcome prediction

癌症 结果(博弈论) 计算机科学 计算生物学 人工智能 内科学 医学 生物 数学 数理经济学
作者
Justin Jee,Christopher J. Fong,Karl Pichotta,Thinh Ngoc Tran,Anisha Luthra,Michele Waters,Chenlian Fu,Mirella L. Altoé,Siyang Liu,Steven B. Maron,Mehnaj Ahmed,Susie Kim,Mono Pirun,Walid K. Chatila,Ino de Bruijn,Arfath Pasha,Ritika Kundra,Benjamin Groß,Brooke Mastrogiacomo,Tyler Aprati
出处
期刊:Nature [Nature Portfolio]
被引量:20
标识
DOI:10.1038/s41586-024-08167-5
摘要

The digitization of health records and growing availability of tumour DNA sequencing provide an opportunity to study the determinants of cancer outcomes with unprecedented richness. Patient data are often stored in unstructured text and siloed datasets. Here we combine natural language processing annotations1,2 with structured medication, patient-reported demographic, tumour registry and tumour genomic data from 24,950 patients at Memorial Sloan Kettering Cancer Center to generate a clinicogenomic, harmonized oncologic real-world dataset (MSK-CHORD). MSK-CHORD includes data for non-small-cell lung (n = 7,809), breast (n = 5,368), colorectal (n = 5,543), prostate (n = 3,211) and pancreatic (n = 3,109) cancers and enables discovery of clinicogenomic relationships not apparent in smaller datasets. Leveraging MSK-CHORD to train machine learning models to predict overall survival, we find that models including features derived from natural language processing, such as sites of disease, outperform those based on genomic data or stage alone as tested by cross-validation and an external, multi-institution dataset. By annotating 705,241 radiology reports, MSK-CHORD also uncovers predictors of metastasis to specific organ sites, including a relationship between SETD2 mutation and lower metastatic potential in immunotherapy-treated lung adenocarcinoma corroborated in independent datasets. We demonstrate the feasibility of automated annotation from unstructured notes and its utility in predicting patient outcomes. The resulting data are provided as a public resource for real-world oncologic research. A study generates a clinicogenomics dataset resource, MSK-CHORD, that combines natural language processing-derived clinical annotations with patient medical data from various sources to improve models of cancer outcome.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
nano完成签到 ,获得积分10
22秒前
逝水完成签到 ,获得积分10
22秒前
完美世界应助科研通管家采纳,获得10
22秒前
梓树完成签到,获得积分10
22秒前
NexusExplorer应助杨惠子采纳,获得10
38秒前
46秒前
杨惠子发布了新的文献求助10
52秒前
酷酷的涵蕾完成签到 ,获得积分10
56秒前
研友_LOqqmZ完成签到 ,获得积分10
58秒前
mickaqi完成签到 ,获得积分10
58秒前
量子星尘发布了新的文献求助20
1分钟前
叶子完成签到 ,获得积分10
1分钟前
asdwind完成签到,获得积分10
1分钟前
wongjc完成签到,获得积分10
1分钟前
点点完成签到 ,获得积分10
1分钟前
1分钟前
Will发布了新的文献求助10
1分钟前
林利芳完成签到 ,获得积分10
1分钟前
veinard应助kittymin采纳,获得40
1分钟前
田田完成签到 ,获得积分10
2分钟前
vitamin完成签到 ,获得积分10
2分钟前
kittymin完成签到,获得积分20
2分钟前
Will完成签到,获得积分10
2分钟前
LeoBigman完成签到 ,获得积分10
2分钟前
雪山飞龙完成签到,获得积分10
3分钟前
3分钟前
机灵听枫发布了新的文献求助10
3分钟前
JMWWW完成签到,获得积分10
3分钟前
煜琪完成签到 ,获得积分10
4分钟前
Liana_Liu完成签到,获得积分10
4分钟前
fogsea完成签到,获得积分0
4分钟前
小鱼女侠完成签到 ,获得积分10
4分钟前
梦游菌完成签到 ,获得积分10
4分钟前
4分钟前
jeronimo完成签到,获得积分10
5分钟前
耕牛热发布了新的文献求助20
5分钟前
领悟完成签到,获得积分0
5分钟前
zhang完成签到 ,获得积分10
5分钟前
葫芦芦芦完成签到 ,获得积分10
6分钟前
安平完成签到,获得积分20
6分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
SOFT MATTER SERIES Volume 22 Soft Matter in Foods 1000
Zur lokalen Geoidbestimmung aus terrestrischen Messungen vertikaler Schweregradienten 1000
Circulating tumor DNA from blood and cerebrospinal fluid in DLBCL: simultaneous evaluation of mutations, IG rearrangement, and IG clonality 500
Food Microbiology - An Introduction (5th Edition) 500
A Systemic-Functional Study of Language Choice in Singapore 400
Architectural Corrosion and Critical Infrastructure 400
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4870706
求助须知:如何正确求助?哪些是违规求助? 4161072
关于积分的说明 12902502
捐赠科研通 3916502
什么是DOI,文献DOI怎么找? 2150836
邀请新用户注册赠送积分活动 1169140
关于科研通互助平台的介绍 1072752