清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Collaborative large language models for automated data extraction in living systematic reviews

计算机科学 数据提取 数据集 集合(抽象数据类型) 人口 工作流程 考试(生物学) 自然语言处理 数据挖掘 人工智能 统计 医学 梅德林 数据库 数学 生物 环境卫生 古生物学 程序设计语言 生物化学
作者
Muhammad Ali Khan,Umair Ayub,Syed Arsalan Ahmed Naqvi,Kaneez Zahra Rubab Khakwani,Zaryab bin Riaz Sipra,Ammad Raina,Sihan Zhou,Huan He,Amir Saeidi,Bashar Hasan,R. Bryan Rumble,Danielle S. Bitterman,Jeremy L. Warner,Jia Zou,Amyé Tevaarwerk,Konstantinos Leventakos,Kenneth L. Kehl,Jeanne Palmer,M. Hassan Murad,Chitta Baral
出处
期刊:Journal of the American Medical Informatics Association [Oxford University Press]
卷期号:32 (4): 638-647 被引量:18
标识
DOI:10.1093/jamia/ocae325
摘要

Abstract Objective Data extraction from the published literature is the most laborious step in conducting living systematic reviews (LSRs). We aim to build a generalizable, automated data extraction workflow leveraging large language models (LLMs) that mimics the real-world 2-reviewer process. Materials and Methods A dataset of 10 trials (22 publications) from a published LSR was used, focusing on 23 variables related to trial, population, and outcomes data. The dataset was split into prompt development (n = 5) and held-out test sets (n = 17). GPT-4-turbo and Claude-3-Opus were used for data extraction. Responses from the 2 LLMs were considered concordant if they were the same for a given variable. The discordant responses from each LLM were provided to the other LLM for cross-critique. Accuracy, ie, the total number of correct responses divided by the total number of responses, was computed to assess performance. Results In the prompt development set, 110 (96%) responses were concordant, achieving an accuracy of 0.99 against the gold standard. In the test set, 342 (87%) responses were concordant. The accuracy of the concordant responses was 0.94. The accuracy of the discordant responses was 0.41 for GPT-4-turbo and 0.50 for Claude-3-Opus. Of the 49 discordant responses, 25 (51%) became concordant after cross-critique, increasing accuracy to 0.76. Discussion Concordant responses by the LLMs are likely to be accurate. In instances of discordant responses, cross-critique can further increase the accuracy. Conclusion Large language models, when simulated in a collaborative, 2-reviewer workflow, can extract data with reasonable performance, enabling truly “living” systematic reviews.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
Dr-Luo完成签到 ,获得积分10
19秒前
荣幸完成签到 ,获得积分10
21秒前
成就的沛菡完成签到 ,获得积分10
23秒前
酷炫忆梅完成签到,获得积分10
24秒前
zaixiaPPL完成签到 ,获得积分10
25秒前
939901842完成签到 ,获得积分10
28秒前
30秒前
俊逸沛菡完成签到 ,获得积分10
31秒前
阿尼完成签到 ,获得积分0
36秒前
towind发布了新的文献求助10
36秒前
温暖完成签到 ,获得积分10
37秒前
李倩完成签到 ,获得积分10
38秒前
小资完成签到 ,获得积分10
41秒前
towind完成签到,获得积分20
43秒前
成就的问枫完成签到 ,获得积分10
43秒前
DianaLee完成签到 ,获得积分10
48秒前
57秒前
丰富的归尘完成签到 ,获得积分10
1分钟前
1分钟前
GingerF应助乐观语海采纳,获得50
1分钟前
1分钟前
含蓄薯片发布了新的文献求助10
1分钟前
魁梧的仙人掌完成签到,获得积分10
1分钟前
aimynora完成签到 ,获得积分10
1分钟前
cwanglh完成签到 ,获得积分10
1分钟前
CodeCraft应助和谐的阁采纳,获得10
2分钟前
我不是哪吒完成签到 ,获得积分10
2分钟前
snubdisphenoid完成签到 ,获得积分10
2分钟前
机智的孤兰完成签到 ,获得积分10
2分钟前
爱学习的瑞瑞子完成签到,获得积分10
2分钟前
Viliam完成签到 ,获得积分10
2分钟前
钉钉完成签到 ,获得积分10
2分钟前
xianyaoz完成签到 ,获得积分10
2分钟前
路漫漫其修远兮完成签到 ,获得积分10
2分钟前
wx1完成签到 ,获得积分0
2分钟前
fvsuar完成签到,获得积分10
3分钟前
迷你的棒球完成签到,获得积分10
3分钟前
毛毛弟完成签到 ,获得积分10
3分钟前
深情安青应助jtyt采纳,获得10
3分钟前
Ray完成签到 ,获得积分10
3分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Inorganic Chemistry Eighth Edition 1200
Free parameter models in liquid scintillation counting 1000
Standards for Molecular Testing for Red Cell, Platelet, and Neutrophil Antigens, 7th edition 1000
The Organic Chemistry of Biological Pathways Second Edition 800
The Psychological Quest for Meaning 800
Signals, Systems, and Signal Processing 610
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6314276
求助须知:如何正确求助?哪些是违规求助? 8130467
关于积分的说明 17037238
捐赠科研通 5370080
什么是DOI,文献DOI怎么找? 2851151
邀请新用户注册赠送积分活动 1828949
关于科研通互助平台的介绍 1681102