清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Early Diagnosis of Pancreatic Cancer via Machine Learning Analysis of a National Electronic Medical Record Database

电子健康档案 医学 人工智能 电子病历 电子数据库 胰腺癌 医疗保健 数据库 癌症 计算机科学 内科学 医疗急救 政治学 法学
作者
Siyabonga Matchaba,Rafik Fellague-Chebra,Purushottam Purushottam,Adam Johns
出处
期刊:JCO clinical cancer informatics [Lippincott Williams & Wilkins]
卷期号: (7) 被引量:1
标识
DOI:10.1200/cci.23.00076
摘要

PURPOSE Pancreatic cancer (PaC) is often diagnosed at advanced stages, resulting in one of the lowest survival rates among patients with cancer. The purpose of this study was to investigate whether machine learning (ML) models can predict with high sensitivity and specificity an increased risk for PaC ahead of clinical diagnosis. METHODS Optum deidentified electronic health record (EHR) data set was used to extract 1-year data for each patient and to sample for PaC diagnosis, the number of interactions with the health care system, and unique demographic and clinical features. Data for patients with PaC diagnosis were collected between 1 and 2 years before the diagnosis. Standard binary classification ML models were used on training and testing data sets. Data analyses were performed using the scikit-learn package version 1.0.1. RESULTS The data set consisted of 18,987 patient EHRs collected between December 31, 2007, and December 31, 2017. EHRs with 10 unique features and at least three health care interactions were used for model training (N = 15,189; n = 8,438 [56%] with PaC) and testing (N = 3,798; n = 2,127 [56%] with PaC). The ensemble model achieved an AUC of 0.89, a sensitivity of 85.61%, and a specificity of 76.18% on the testing data set and produced superior results compared with other binary classifiers. Increasing unique health care interactions to nine failed to improve the AUC score. When the testing data set was enlarged to 5,696 patients, the ensemble model achieved an AUC of 0.92 and a specificity of 93.21%, but the sensitivity was compromised. CONCLUSION The ensemble model exceeded the state-of-the-art level of performance for prediction of PaC ahead of clinical diagnosis with a minimal clinically guided input, providing a potential strategy for selection of high-risk patients for further screening.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
量子星尘发布了新的文献求助10
11秒前
赧赧完成签到 ,获得积分10
22秒前
大饼完成签到 ,获得积分10
29秒前
胡国伦完成签到 ,获得积分10
39秒前
火之高兴完成签到 ,获得积分10
53秒前
迷茫的一代完成签到,获得积分10
54秒前
包包琪完成签到 ,获得积分10
1分钟前
科研通AI2S应助科研通管家采纳,获得10
1分钟前
JamesPei应助科研通管家采纳,获得10
1分钟前
花落无声完成签到 ,获得积分10
1分钟前
斯文败类应助Jessie采纳,获得10
1分钟前
1分钟前
1分钟前
Luna爱科研完成签到 ,获得积分10
1分钟前
Jessie发布了新的文献求助10
1分钟前
量子星尘发布了新的文献求助10
2分钟前
暮晓见完成签到 ,获得积分10
2分钟前
是真的完成签到 ,获得积分10
2分钟前
白桃完成签到 ,获得积分10
3分钟前
量子星尘发布了新的文献求助10
3分钟前
耶耶耶完成签到 ,获得积分10
3分钟前
4分钟前
twk发布了新的文献求助10
4分钟前
poki完成签到 ,获得积分10
4分钟前
4分钟前
晨雾锁阳完成签到 ,获得积分10
4分钟前
量子星尘发布了新的文献求助10
5分钟前
科研通AI2S应助科研通管家采纳,获得10
5分钟前
珂珂完成签到 ,获得积分10
5分钟前
trophozoite完成签到 ,获得积分10
5分钟前
Orange应助Jessie采纳,获得10
5分钟前
5分钟前
xue完成签到 ,获得积分10
6分钟前
嗯嗯嗯哦哦哦完成签到 ,获得积分10
6分钟前
6分钟前
Jessie发布了新的文献求助10
6分钟前
PeterLin完成签到,获得积分10
6分钟前
蒲公英完成签到 ,获得积分10
6分钟前
量子星尘发布了新的文献求助10
6分钟前
lh完成签到 ,获得积分10
6分钟前
高分求助中
(禁止应助)【重要!!请各位详细阅读】【科研通的精品贴汇总】 10000
Local Grammar Approaches to Speech Act Studies 5000
Plutonium Handbook 4000
International Code of Nomenclature for algae, fungi, and plants (Madrid Code) (Regnum Vegetabile) 1500
Building Quantum Computers 1000
Robot-supported joining of reinforcement textiles with one-sided sewing heads 900
Molecular Cloning: A Laboratory Manual (Fourth Edition) 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4222903
求助须知:如何正确求助?哪些是违规求助? 3755988
关于积分的说明 11806906
捐赠科研通 3418840
什么是DOI,文献DOI怎么找? 1876389
邀请新用户注册赠送积分活动 929991
科研通“疑难数据库(出版商)”最低求助积分说明 838341