Developing a computable phenotype for glioblastoma

图表 诊断代码 计算机科学 电子健康档案 病历 健康档案 胶质母细胞瘤 F1得分 人口 非结构化数据 医学 数据挖掘 自然语言处理 人工智能 医疗保健 内科学 数学 统计 大数据 癌症研究 经济增长 经济 环境卫生
作者
Sandra C. Yan,Kaitlyn Melnick,Xing He,Tianchen Lyu,Rachel Moor,Megan Still,Duane A. Mitchell,Elizabeth Shenkman,Han Wang,Yi Guo,Jiang Bian,Ashley Ghiaseddin
出处
期刊:Neuro-oncology [Oxford University Press]
卷期号:26 (6): 1163-1170
标识
DOI:10.1093/neuonc/noad249
摘要

Abstract Background Glioblastoma is the most common malignant brain tumor, and thus it is important to be able to identify patients with this diagnosis for population studies. However, this can be challenging as diagnostic codes are nonspecific. The aim of this study was to create a computable phenotype (CP) for glioblastoma multiforme (GBM) from structured and unstructured data to identify patients with this condition in a large electronic health record (EHR). Methods We used the University of Florida (UF) Health Integrated Data Repository, a centralized clinical data warehouse that stores clinical and research data from various sources within the UF Health system, including the EHR system. We performed multiple iterations to refine the GBM-relevant diagnosis codes, procedure codes, medication codes, and keywords through manual chart review of patient data. We then evaluated the performances of various possible proposed CPs constructed from the relevant codes and keywords. Results We underwent six rounds of manual chart reviews to refine the CP elements. The final CP algorithm for identifying GBM patients was selected based on the best F1-score. Overall, the CP rule “if the patient had at least 1 relevant diagnosis code and at least 1 relevant keyword” demonstrated the highest F1-score using both structured and unstructured data. Thus, it was selected as the best-performing CP rule. Conclusions We developed and validated a CP algorithm for identifying patients with GBM using both structured and unstructured EHR data from a large tertiary care center. The final algorithm achieved an F1-score of 0.817, indicating a high performance, which minimizes possible biases from misclassification errors.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
星宿陨发布了新的文献求助20
1秒前
tong完成签到 ,获得积分10
1秒前
爱吃蒸蛋完成签到,获得积分10
1秒前
先点菜吧发布了新的文献求助10
2秒前
优雅子骞发布了新的文献求助10
2秒前
哈基米德应助wintersss采纳,获得30
2秒前
XF完成签到,获得积分10
3秒前
liam发布了新的文献求助10
3秒前
丘比特应助果粒橙980采纳,获得10
3秒前
希望天下0贩的0应助WJ采纳,获得30
3秒前
3秒前
Chirs完成签到,获得积分10
5秒前
5秒前
科研通AI5应助辰时采纳,获得10
5秒前
科目三应助Junsir采纳,获得10
6秒前
鸣笛应助默默尔安采纳,获得10
7秒前
田様应助胡子采纳,获得10
8秒前
研友_VZG7GZ应助小蚂蚁森采纳,获得10
8秒前
愉快新筠发布了新的文献求助10
9秒前
平常幼菱完成签到,获得积分20
10秒前
昏睡的蟠桃应助坤坤采纳,获得50
10秒前
liam完成签到,获得积分20
10秒前
忧心的寄松完成签到,获得积分10
11秒前
仰泳的鱼完成签到,获得积分10
11秒前
SciGPT应助corner采纳,获得10
13秒前
13秒前
传奇3应助yellow采纳,获得10
13秒前
Hesper完成签到 ,获得积分10
15秒前
valorb完成签到,获得积分0
15秒前
哈基米德应助wintersss采纳,获得10
16秒前
17秒前
18秒前
20秒前
21秒前
舒适的天奇完成签到 ,获得积分10
21秒前
21秒前
ZJJ完成签到,获得积分10
22秒前
西伯侯完成签到,获得积分10
23秒前
绅度发布了新的文献求助10
23秒前
薛定谔的猫完成签到,获得积分10
24秒前
高分求助中
【请各位用户详细阅读此贴后再求助】科研通的精品贴汇总(请勿应助) 10000
【提示信息,请勿应助】关于scihub 10000
Les Mantodea de Guyane: Insecta, Polyneoptera [The Mantids of French Guiana] 3000
徐淮辽南地区新元古代叠层石及生物地层 3000
The Mother of All Tableaux: Order, Equivalence, and Geometry in the Large-scale Structure of Optimality Theory 3000
Research on Disturbance Rejection Control Algorithm for Aerial Operation Robots 1000
Global Eyelash Assessment scale (GEA) 1000
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4045849
求助须知:如何正确求助?哪些是违规求助? 3583534
关于积分的说明 11389428
捐赠科研通 3310798
什么是DOI,文献DOI怎么找? 1822063
邀请新用户注册赠送积分活动 894214
科研通“疑难数据库(出版商)”最低求助积分说明 816067