The Mixed Subjects Design: Treating Large Language Models as Potentially Informative Observations

心理学 计算机科学 计量经济学 自然语言处理 认知心理学 数学
作者
David Broska,Michael Howes,Austin van Loon
标识
DOI:10.31235/osf.io/j3bnt_v2
摘要

Large Language Models (LLMs) provide cost-effective but possibly inaccurate predictions of human behavior. Despite growing evidence that predicted and observed behavior are often not interchangeable, there is limited guidance on using LLMs to obtain valid estimates of causal effects and other parameters. We argue that LLM predictions should be treated as potentially informative observations, while human subjects serve as a gold standard in a mixed subjects design. This paradigm preserves validity and offers more precise estimates at a lower cost than experiments relying exclusively on human subjects. We demonstrate–and extend–prediction-powered inference (PPI), a method that combines predictions and observations. We define the PPI correlation as a measure of interchangeability and derive the effective sample size for PPI. We also introduce a power analysis to optimally choose between informative but costly human subjects and less informative but cheap predictions of human behavior. Mixed subjects designs could enhance scientific productivity and reduce inequality in access to costly evidence.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
流年发布了新的文献求助10
刚刚
SJT完成签到,获得积分10
刚刚
比亚迪士尼在逃公主完成签到,获得积分10
刚刚
Yiwaa完成签到,获得积分10
刚刚
十月天完成签到,获得积分10
刚刚
1秒前
2秒前
Zhao完成签到 ,获得积分10
2秒前
4秒前
Pipper完成签到,获得积分10
5秒前
5秒前
jason发布了新的文献求助10
6秒前
伊莎贝儿发布了新的文献求助10
6秒前
6秒前
iW完成签到 ,获得积分10
6秒前
laola完成签到,获得积分10
6秒前
阳光的友易完成签到 ,获得积分10
7秒前
隐形荟完成签到 ,获得积分10
7秒前
干焱完成签到,获得积分10
7秒前
能干的邹完成签到 ,获得积分10
7秒前
8秒前
科研通AI5应助mao采纳,获得10
8秒前
8秒前
章慕思完成签到 ,获得积分10
8秒前
隐形之玉完成签到,获得积分10
8秒前
募股小完成签到,获得积分10
8秒前
迷路初兰发布了新的文献求助10
9秒前
肖燕完成签到 ,获得积分10
9秒前
9秒前
坚果儿完成签到,获得积分20
10秒前
何佳完成签到,获得积分10
10秒前
11秒前
宁羽发布了新的文献求助10
11秒前
12秒前
tiankong完成签到,获得积分10
12秒前
Nia发布了新的文献求助30
13秒前
日立天上完成签到,获得积分10
13秒前
花样年华完成签到,获得积分0
14秒前
猪猪女孩发布了新的文献求助10
14秒前
直率的彤发布了新的文献求助10
15秒前
高分求助中
Thinking Small and Large 500
Algorithmic Mathematics in Machine Learning 500
Getting Published in SSCI Journals: 200+ Questions and Answers for Absolute Beginners 300
The Monocyte-to-HDL ratio (MHR) as a prognostic and diagnostic biomarker in Acute Ischemic Stroke: A systematic review with meta-analysis (P9-14.010) 240
The Handbook of Medicinal Chemistry: Principles and Practice 200
Interpretability and Explainability in AI Using Python 200
SPECIAL FEATURES OF THE EXCHANGE INTERACTIONS IN ORTHOFERRITE-ORTHOCHROMITES 200
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3834097
求助须知:如何正确求助?哪些是违规求助? 3376554
关于积分的说明 10493831
捐赠科研通 3096024
什么是DOI,文献DOI怎么找? 1704828
邀请新用户注册赠送积分活动 820115
科研通“疑难数据库(出版商)”最低求助积分说明 771868