Leveraging electronic health records for data science: common pitfalls and how to avoid them

过度拟合 数据科学 计算机科学 工作流程 健康档案 稳健性(进化) 样品(材料) 变量(数学) 软件部署 样本量测定 数据挖掘 风险分析(工程) 医疗保健 人工智能 医学 数据库 统计 软件工程 基因 数学分析 经济 生物化学 人工神经网络 化学 经济增长 色谱法 数学
作者
Christopher Martin Sauer,Li-Ching Chen,Stephanie L Hyland,Armand R.J. Girbes,Paul Elbers,Leo Anthony Celi
出处
期刊:The Lancet Digital Health [Elsevier]
卷期号:4 (12): e893-e898 被引量:29
标识
DOI:10.1016/s2589-7500(22)00154-6
摘要

Analysis of electronic health records (EHRs) is an increasingly common approach for studying real-world patient data. Use of routinely collected data offers several advantages compared with other study designs, including reduced administrative costs, the ability to update analysis as practice patterns evolve, and larger sample sizes. Methodologically, EHR analysis is subject to distinct challenges because data are not collected for research purposes. In this Viewpoint, we elaborate on the importance of in-depth knowledge of clinical workflows and describe six potential pitfalls to be avoided when working with EHR data, drawing on examples from the literature and our experience. We propose solutions for prevention or mitigation of factors associated with each of these six pitfalls-sample selection bias, imprecise variable definitions, limitations to deployment, variable measurement frequency, subjective treatment allocation, and model overfitting. Ultimately, we hope that this Viewpoint will guide researchers to further improve the methodological robustness of EHR analysis.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
大利发布了新的文献求助10
1秒前
1秒前
乐兰正雪完成签到,获得积分10
2秒前
阔达的扬完成签到,获得积分10
3秒前
阔达的扬发布了新的文献求助10
6秒前
Anoxia发布了新的文献求助30
8秒前
大利完成签到,获得积分10
8秒前
可爱的函函应助Kate采纳,获得10
11秒前
领导范儿应助Sophie采纳,获得10
14秒前
小二郎应助Lin采纳,获得10
16秒前
大白发布了新的文献求助10
16秒前
nuyoahmay完成签到 ,获得积分10
17秒前
有人应助zhouzhm5采纳,获得10
17秒前
斯文败类应助echo123采纳,获得10
19秒前
22秒前
22秒前
风中的马里奥完成签到,获得积分10
23秒前
25秒前
PANGHU发布了新的文献求助10
25秒前
26秒前
27秒前
Kate发布了新的文献求助10
28秒前
务实的秋灵完成签到,获得积分10
30秒前
ZeradesY完成签到,获得积分10
30秒前
30秒前
SOLOMON应助科研通管家采纳,获得10
31秒前
彭于晏应助科研通管家采纳,获得10
31秒前
Yxy完成签到 ,获得积分10
31秒前
甜甜玫瑰应助科研通管家采纳,获得10
31秒前
SOLOMON应助科研通管家采纳,获得10
31秒前
星辰大海应助科研通管家采纳,获得10
31秒前
31秒前
情怀应助科研通管家采纳,获得10
32秒前
充电宝应助科研通管家采纳,获得10
32秒前
江流有声发布了新的文献求助10
33秒前
张伟发布了新的文献求助10
33秒前
南山尾发布了新的文献求助10
33秒前
33秒前
Wait for a M完成签到 ,获得积分10
34秒前
乐乐应助张伟采纳,获得10
38秒前
高分求助中
请在求助之前详细阅读求助说明!!!! 20000
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 1000
Sphäroguß als Werkstoff für Behälter zur Beförderung, Zwischen- und Endlagerung radioaktiver Stoffe - Untersuchung zu alternativen Eignungsnachweisen: Zusammenfassender Abschlußbericht 1000
Yuwu Song, Biographical Dictionary of the People's Republic of China 700
[Lambert-Eaton syndrome without calcium channel autoantibodies] 520
The Three Stars Each: The Astrolabes and Related Texts 500
Additive Manufacturing Design and Applications 320
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2466453
求助须知:如何正确求助?哪些是违规求助? 2134622
关于积分的说明 5439667
捐赠科研通 1859881
什么是DOI,文献DOI怎么找? 925107
版权声明 562626
科研通“疑难数据库(出版商)”最低求助积分说明 494918