发布文献求助

Performance of large language models in oral and maxillofacial surgery examinations

口腔颌面外科医学牙科普通外科医学物理学

作者

Bernadette Quah,Chee Weng Yong,Clement Wei Ming Lai,Intekhab Islam

出处

期刊：International Journal of Oral and Maxillofacial Surgery [Elsevier BV]
日期：2024-10-01 卷期号：53 (10): 881-886 被引量：6

链接

标识

DOI：10.1016/j.ijom.2024.06.003

摘要

This study aimed to determine the accuracy of large language models (LLMs) in answering oral and maxillofacial surgery (OMS) multiple choice questions. A total of 259 questions from the university's question bank were answered by the LLMs (GPT-3.5, GPT-4, Llama 2, Gemini, and Copilot). The scores per category as well as the total score out of 259 were recorded and evaluated, with the passing score set at 50%. The mean overall score amongst all LLMs was 62.5%. GPT-4 performed the best (76.8%, 95% confidence interval (CI) 71.4-82.2%), followed by Copilot (72.6%, 95% CI 67.2-78.0%), GPT-3.5 (62.2%, 95% CI 56.4-68.0%), Gemini (58.7%, 95% CI 52.9-64.5%), and Llama 2 (42.5%, 95% CI 37.1-48.6%). There was a statistically significant difference between the scores of the five LLMs overall (χ

求助该文献

最长约 10秒，即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI

我的文献求助列表浏览历史

一分钟了解求助规则 | 捐赠本站 | 历史今天

活动

『应助活动周』获奖名单已公布 🔥 (2025-4-2)

更新

『中科院2025期刊分区』已更新 (2025-3-23)

更新

『即时热点』模块已上线 (2025-2-28)

科研通是完全免费的文献互助平台，具备全网最快的应助速度，最高的求助完成率。对每一个文献求助，科研通都将尽心尽力，给求助人一个满意的交代。

实时播报: 稳重母鸡完成签到，获得积分10

1秒前; 吉祥高趙完成签到，获得积分10

1秒前; cdercder的应助被大胆的凡采纳，获得10

2秒前; 小园饼干完成签到，获得积分10

2秒前; 胡图图完成签到，获得积分10

3秒前; 整齐冬瓜完成签到，获得积分10

3秒前; 开心的萝莉完成签到，获得积分10

3秒前; 可怜的小羊完成签到，获得积分10

4秒前; LEE123完成签到，获得积分10

4秒前; 无餍上传了应助文件

4秒前; 依依完成签到，获得积分10

4秒前; 鲤鱼怀绿完成签到，获得积分10

4秒前; 11111111111完成签到，获得积分10

5秒前; 淡定从霜完成签到，获得积分10

5秒前; 早睡能长个完成签到，获得积分10

5秒前; 8R60d8的应助被木木木采纳，获得10

5秒前; 我能行完成签到，获得积分10

6秒前; 远方的蓝风铃完成签到，获得积分10

6秒前; 稳重奇异果完成签到，获得积分10

6秒前; 华仔上传了应助文件

7秒前; SC武完成签到，获得积分10

7秒前; 微纳组刘同完成签到，获得积分10

7秒前; 上官若男的应助被蟹蟹采纳，获得10

8秒前; 昏睡的蟠桃的应助被朱晖采纳，获得50

8秒前; 呜呜呜呜呜呜呜呜完成签到，获得积分10

8秒前; 研友_Raven完成签到，获得积分10

8秒前; 彭于彦祖完成签到，获得积分0

8秒前; 汉堡包的应助被兰栀倾怀采纳，获得10

9秒前; 无餍的应助被微笑的兔子采纳，获得10

10秒前; 百里烬言完成签到，获得积分10

10秒前; aabbfz发布了新的文献求助10

10秒前; 打打上传了应助文件

10秒前; 落寒完成签到，获得积分10

12秒前; 解靖宇完成签到，获得积分10

12秒前; Orange的应助被一念初见采纳，获得10

13秒前; ximei完成签到，获得积分10

14秒前; 冷傲的忆秋发布了新的文献求助10

14秒前; xxy完成签到，获得积分10

14秒前; slsdy完成签到，获得积分10

15秒前; Zen完成签到，获得积分10

16秒前

高分求助中: Encyclopedia of Mathematical Physics 2nd edition 888; Technologies supporting mass customization of apparel: A pilot project 600; Introduction to Strong Mixing Conditions Volumes 1-3 500; Pharmacological profile of sulodexide 400; Optical and electric properties of monocrystalline synthetic diamond irradiated by neutrons 320; 共融服務學習指南 300; Essentials of Pharmacoeconomics: Health Economics and Outcomes Research 3rd Edition. by Karen Rascati 300

热门求助领域（近24小时）

热门帖子: 关注科研通微信公众号，转发送积分 3804360; 求助须知：如何正确求助？哪些是违规求助？ 3349199; 关于积分的说明 10342245; 捐赠科研通 3065248; 什么是DOI，文献DOI怎么找？ 1682994; 邀请新用户注册赠送积分活动 808622; 科研通“疑难数据库（出版商）”最低求助积分说明 764629

今日热心研友

剑指东方是为谁

平常的毛豆

昏睡的蟠桃

飞快的泥猴桃

可千万不要躺平呀

就叫柠檬吧

期待未来的自己

注：热心度 = 本日应助数 + 本日被采纳获取积分÷10

Copyright © 2020-2025 AbleSci.COM, 科研通, All Right Reserved

科研通是非营利科研互助平台，不忘初心，为科研助力

本站互助的所有文件仅供个人学习研究用，禁止任何人把求助的所得文献进行盈利或传播

皖ICP备2024041134号-1

皖公网安备34019202002308

科研通【文献互助QQ群】：如果您有特殊求助，或发布求助超过24小时未得到应助，可加群求助，群号：941272744【点击一键加群】

科研通【志愿服务QQ群】：如果您热爱文献互助，有热心愿意为更多人服务，请加入小伙伴群，点击申请加入

关注微信服务号

科研通