Out of One, Many: Using Language Models to Simulate Human Samples

多样性(控制论) 忠诚 计算机科学 背景(考古学) 社会文化进化 意义(存在) 数据科学 相似性(几何) 人工智能 认知心理学 心理学 社会学 古生物学 心理治疗师 图像(数学) 生物 电信 人类学
作者
Lisa P. Argyle,Ethan C. Busby,Nancy Fulda,Joshua R. Gubler,Christopher Rytting,David Wingate
出处
期刊:Political Analysis [Cambridge University Press]
卷期号:31 (3): 337-351 被引量:241
标识
DOI:10.1017/pan.2023.2
摘要

Abstract We propose and explore the possibility that language models can be studied as effective proxies for specific human subpopulations in social science research. Practical and research applications of artificial intelligence tools have sometimes been limited by problematic biases (such as racism or sexism), which are often treated as uniform properties of the models. We show that the “algorithmic bias” within one such tool—the GPT-3 language model—is instead both fine-grained and demographically correlated, meaning that proper conditioning will cause it to accurately emulate response distributions from a wide variety of human subgroups. We term this property algorithmic fidelity and explore its extent in GPT-3. We create “silicon samples” by conditioning the model on thousands of sociodemographic backstories from real human participants in multiple large surveys conducted in the United States. We then compare the silicon and human samples to demonstrate that the information contained in GPT-3 goes far beyond surface similarity. It is nuanced, multifaceted, and reflects the complex interplay between ideas, attitudes, and sociocultural context that characterize human attitudes. We suggest that language models with sufficient algorithmic fidelity thus constitute a novel and powerful tool to advance understanding of humans and society across a variety of disciplines.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
orange2806完成签到 ,获得积分10
1秒前
1秒前
徐doc完成签到 ,获得积分10
6秒前
和平完成签到 ,获得积分10
11秒前
田様应助含蓄的明雪采纳,获得10
15秒前
16秒前
CaoJing完成签到 ,获得积分10
18秒前
会飞的猪完成签到,获得积分10
19秒前
mufulee完成签到,获得积分10
19秒前
coolkid应助科研通管家采纳,获得20
20秒前
ybwei2008_163发布了新的文献求助10
21秒前
Glory完成签到 ,获得积分10
26秒前
含蓄的明雪完成签到,获得积分10
27秒前
30秒前
33秒前
34秒前
ybwei2008_163发布了新的文献求助10
38秒前
yi完成签到 ,获得积分10
42秒前
丁丁丁完成签到,获得积分10
43秒前
一颗小洋葱完成签到 ,获得积分10
44秒前
leo完成签到,获得积分10
46秒前
ybwei2008_163完成签到,获得积分20
46秒前
52秒前
蚂蚁踢大象完成签到 ,获得积分10
1分钟前
jane完成签到 ,获得积分10
1分钟前
cdercder完成签到,获得积分0
1分钟前
Ida完成签到 ,获得积分10
1分钟前
lisa完成签到 ,获得积分10
1分钟前
wuda完成签到,获得积分10
1分钟前
柏事完成签到 ,获得积分10
1分钟前
shyxia完成签到 ,获得积分10
1分钟前
Skywalk满天星完成签到,获得积分10
1分钟前
yanny完成签到,获得积分10
1分钟前
xinyueyue完成签到,获得积分10
1分钟前
LiangRen完成签到 ,获得积分10
1分钟前
兔兔完成签到 ,获得积分10
1分钟前
东郭一斩完成签到,获得积分10
1分钟前
penguin完成签到,获得积分10
1分钟前
1分钟前
keep完成签到,获得积分10
2分钟前
高分求助中
Applied Survey Data Analysis (第三版, 2025) 800
Narcissistic Personality Disorder 700
Research Handbook on Multiculturalism 500
The Martian climate revisited: atmosphere and environment of a desert planet 500
Face recognition: challenges,achievementsandfuture directions. 400
Plasmonics 400
建国初期十七年翻译活动的实证研究. 建国初期十七年翻译活动的实证研究 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3847893
求助须知:如何正确求助?哪些是违规求助? 3390526
关于积分的说明 10561737
捐赠科研通 3110924
什么是DOI,文献DOI怎么找? 1714590
邀请新用户注册赠送积分活动 825289
科研通“疑难数据库(出版商)”最低求助积分说明 775471