亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Can large language models provide useful feedback on research papers? A large-scale empirical analysis

计算机科学 比例(比率) 管道(软件) 同行评审 质量(理念) 实证研究 领域(数学) 同行反馈 反馈控制 数据科学 心理学 数学教育 政治学 数学 统计 工程类 地理 控制工程 认识论 哲学 程序设计语言 法学 纯数学 地图学
作者
Weixin Liang,Yuhui Zhang,Hancheng Cao,Binglu Wang,Daisy Yi Ding,Xiawei Yang,Kailas Vodrahalli,Siyu He,Daniel Scott Smith,Yongsheng Yin,Daniel A. McFarland,James Zou
出处
期刊:Cornell University - arXiv 被引量:1
标识
DOI:10.48550/arxiv.2310.01783
摘要

Expert feedback lays the foundation of rigorous research. However, the rapid growth of scholarly production and intricate knowledge specialization challenge the conventional scientific feedback mechanisms. High-quality peer reviews are increasingly difficult to obtain. Researchers who are more junior or from under-resourced settings have especially hard times getting timely feedback. With the breakthrough of large language models (LLM) such as GPT-4, there is growing interest in using LLMs to generate scientific feedback on research manuscripts. However, the utility of LLM-generated feedback has not been systematically studied. To address this gap, we created an automated pipeline using GPT-4 to provide comments on the full PDFs of scientific papers. We evaluated the quality of GPT-4's feedback through two large-scale studies. We first quantitatively compared GPT-4's generated feedback with human peer reviewer feedback in 15 Nature family journals (3,096 papers in total) and the ICLR machine learning conference (1,709 papers). The overlap in the points raised by GPT-4 and by human reviewers (average overlap 30.85% for Nature journals, 39.23% for ICLR) is comparable to the overlap between two human reviewers (average overlap 28.58% for Nature journals, 35.25% for ICLR). The overlap between GPT-4 and human reviewers is larger for the weaker papers. We then conducted a prospective user study with 308 researchers from 110 US institutions in the field of AI and computational biology to understand how researchers perceive feedback generated by our GPT-4 system on their own papers. Overall, more than half (57.4%) of the users found GPT-4 generated feedback helpful/very helpful and 82.4% found it more beneficial than feedback from at least some human reviewers. While our findings show that LLM-generated feedback can help researchers, we also identify several limitations.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
传奇3应助zzx采纳,获得10
22秒前
ARESCI发布了新的文献求助10
24秒前
29秒前
温暖的紫文完成签到,获得积分10
31秒前
33秒前
37秒前
coco完成签到 ,获得积分10
41秒前
zzx发布了新的文献求助10
43秒前
49秒前
oleskarabach完成签到,获得积分10
52秒前
wuujuan发布了新的文献求助10
54秒前
SOLOMON应助ARESCI采纳,获得10
1分钟前
SOLOMON应助ARESCI采纳,获得10
1分钟前
oleskarabach发布了新的文献求助10
1分钟前
虚幻豌豆发布了新的文献求助10
1分钟前
共享精神应助oleskarabach采纳,获得10
2分钟前
孤鸿影98完成签到 ,获得积分10
2分钟前
wtsow完成签到,获得积分10
3分钟前
香蕉觅云应助科研通管家采纳,获得10
3分钟前
寻道图强应助科研通管家采纳,获得10
3分钟前
我的小名叫雷锋完成签到 ,获得积分10
4分钟前
4分钟前
Ameng发布了新的文献求助10
4分钟前
5分钟前
隐形曼青应助不样钓鱼采纳,获得10
5分钟前
谷粱向秋发布了新的文献求助10
5分钟前
ZWTH完成签到,获得积分10
6分钟前
6分钟前
喜悦香萱完成签到 ,获得积分10
6分钟前
123发布了新的文献求助10
6分钟前
ding应助123采纳,获得10
6分钟前
gu完成签到 ,获得积分10
7分钟前
大个应助科研通管家采纳,获得10
7分钟前
8分钟前
8分钟前
小橘子发布了新的文献求助30
8分钟前
若眠完成签到 ,获得积分10
8分钟前
Sandy完成签到 ,获得积分10
9分钟前
顾矜应助鸡腿子采纳,获得10
9分钟前
田様应助虚幻豌豆采纳,获得10
9分钟前
高分求助中
The three stars each : the Astrolabes and related texts 1070
Manual of Clinical Microbiology, 4 Volume Set (ASM Books) 13th Edition 1000
Sport in der Antike 800
De arte gymnastica. The art of gymnastics 600
少脉山油柑叶的化学成分研究 530
Chen Jian - Zhou Enlai: A Life (2024) 500
Sport in der Antike Hardcover – March 1, 2015 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2406602
求助须知:如何正确求助?哪些是违规求助? 2104083
关于积分的说明 5310925
捐赠科研通 1831704
什么是DOI,文献DOI怎么找? 912717
版权声明 560655
科研通“疑难数据库(出版商)”最低求助积分说明 487965