Automated Extraction and Classification of Drug Prescriptions in Electronic Health Records: Introducing the PRESNER Pipeline

药方 生命银行 管道(软件) 计算机科学 健康信息学 电子健康档案 药物基因组学 健康档案 数据挖掘 信息学 医学 药物警戒 命名实体识别 数据科学 人工智能 药品 情报检索 工程类 生物信息学 药理学 医疗保健 公共卫生 任务(项目管理) 护理部 系统工程 电气工程 经济 生物 程序设计语言 经济增长
作者
Cristobal Colón-Ruíz,Tomas Fitzgerald,Isabel Segura-Bedmar,Ewan Birney,María Herrero-Zazo
出处
期刊:Cold Spring Harbor Laboratory - medRxiv 被引量:2
标识
DOI:10.1101/2023.10.04.23296481
摘要

Abstract Electronic health record (EHR) systems with prescription data offer vast potential in pharmacoepidemiology and pharmacogenomics. The large amount of clinical data recorded in these systems requires automatic processing to extract relevant information. This paper introduces PRESNER, a name entity recognition (NER) and classification pipeline for EHR prescription data. The pipeline uses the pre-trained transformer Bio-ClinicalBERT fine-tuned on UK Biobank prescription entries manually annotated with medication-related information (drug name, route of administration, pharmaceutical form, strength, and dosage) as the core NER system. Moreover, PRESNER also maps drugs to the Anatomical Therapeutic and Chemical (ATC) classification system and distinguishes between systemic and non-systemic drug products. It outperformed a baseline model combining the state-of-the-art Med7 and a dictionary-based approach from the ChEMBL database with a macro-average F1-score of 0.95 vs 0.71. In addition to UK Biobank prescription data, PRESNER can also be applied to other English prescription datasets, making it a versatile tool for researchers in the field.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
2秒前
勇猛的西瓜完成签到,获得积分10
8秒前
8秒前
9秒前
汉堡包应助牛洋洋采纳,获得10
10秒前
沉静白云完成签到,获得积分10
10秒前
LeezZZZ发布了新的文献求助10
13秒前
眼睛大的笑阳完成签到,获得积分20
15秒前
香蕉觅云应助LeezZZZ采纳,获得10
24秒前
25秒前
student完成签到 ,获得积分10
27秒前
晓宇发布了新的文献求助10
29秒前
太阳完成签到 ,获得积分10
31秒前
32秒前
球球尧伞耳完成签到,获得积分10
36秒前
Xiang发布了新的文献求助30
37秒前
今后应助俏皮的一一采纳,获得10
39秒前
轻松的书南完成签到 ,获得积分10
42秒前
43秒前
45秒前
Xiang完成签到,获得积分20
46秒前
尘默完成签到,获得积分10
48秒前
QIQI发布了新的文献求助10
48秒前
盐汽水完成签到 ,获得积分10
50秒前
不会科研的混子完成签到 ,获得积分10
50秒前
LeezZZZ发布了新的文献求助10
51秒前
飞兰完成签到,获得积分10
55秒前
猩猩完成签到,获得积分10
55秒前
56秒前
57秒前
58秒前
bkagyin应助LeezZZZ采纳,获得10
58秒前
59秒前
jie发布了新的文献求助10
1分钟前
日光下完成签到 ,获得积分10
1分钟前
pluto应助xiaowentu采纳,获得10
1分钟前
1分钟前
Four_twos完成签到,获得积分10
1分钟前
tt发布了新的文献求助10
1分钟前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
Maneuvering of a Damaged Navy Combatant 650
Периодизация спортивной тренировки. Общая теория и её практическое применение 310
Mixing the elements of mass customisation 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3778437
求助须知:如何正确求助?哪些是违规求助? 3324161
关于积分的说明 10217227
捐赠科研通 3039379
什么是DOI,文献DOI怎么找? 1668012
邀请新用户注册赠送积分活动 798463
科研通“疑难数据库(出版商)”最低求助积分说明 758385