已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Ethical and social risks of harm from Language Models

危害 误传 多学科方法 风险分析(工程) 风险管理 互联网隐私 心理学 业务 公共关系 社会心理学 政治学 计算机安全 计算机科学 社会学 社会科学 财务
作者
Laura Weidinger,John W. Mellor,Maribeth Rauh,Conor Griffin,Jonathan Uesato,Po-Sen Huang,Myra Cheng,Mia Glaese,Borja Balle,Atoosa Kasirzadeh,Zac Kenton,Sasha Brown,Will Hawkins,Tom Stepleton,Courtney Biles,Abeba Birhane,Julia Haas,Laura Rimell,Lisa Anne Hendricks,William M. Isaac
出处
期刊:Cornell University - arXiv 被引量:71
标识
DOI:10.48550/arxiv.2112.04359
摘要

This paper aims to help structure the risk landscape associated with large-scale Language Models (LMs). In order to foster advances in responsible innovation, an in-depth understanding of the potential risks posed by these models is needed. A wide range of established and anticipated risks are analysed in detail, drawing on multidisciplinary expertise and literature from computer science, linguistics, and social sciences. We outline six specific risk areas: I. Discrimination, Exclusion and Toxicity, II. Information Hazards, III. Misinformation Harms, V. Malicious Uses, V. Human-Computer Interaction Harms, VI. Automation, Access, and Environmental Harms. The first area concerns the perpetuation of stereotypes, unfair discrimination, exclusionary norms, toxic language, and lower performance by social group for LMs. The second focuses on risks from private data leaks or LMs correctly inferring sensitive information. The third addresses risks arising from poor, false or misleading information including in sensitive domains, and knock-on risks such as the erosion of trust in shared information. The fourth considers risks from actors who try to use LMs to cause harm. The fifth focuses on risks specific to LLMs used to underpin conversational agents that interact with human users, including unsafe use, manipulation or deception. The sixth discusses the risk of environmental harm, job automation, and other challenges that may have a disparate effect on different social groups or communities. In total, we review 21 risks in-depth. We discuss the points of origin of different risks and point to potential mitigation approaches. Lastly, we discuss organisational responsibilities in implementing mitigations, and the role of collaboration and participation. We highlight directions for further research, particularly on expanding the toolkit for assessing and evaluating the outlined risks in LMs.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
李某发布了新的文献求助10
1秒前
jingjing发布了新的文献求助10
1秒前
果冻发布了新的文献求助10
1秒前
3秒前
3秒前
daodao发布了新的文献求助10
5秒前
科研通AI2S应助不喜采纳,获得10
6秒前
时尚雁玉发布了新的文献求助10
7秒前
7秒前
9秒前
半山完成签到,获得积分10
9秒前
深情安青应助李某采纳,获得10
10秒前
11秒前
王王瑶完成签到,获得积分10
12秒前
Jenny关注了科研通微信公众号
12秒前
Hairee发布了新的文献求助10
12秒前
wssamuel完成签到 ,获得积分10
13秒前
稳重的小刺猬完成签到,获得积分10
15秒前
橙色小瓶子完成签到,获得积分10
15秒前
姜姜发布了新的文献求助10
15秒前
可颂完成签到 ,获得积分10
18秒前
19秒前
shelly发布了新的文献求助10
19秒前
ZengZeng_完成签到,获得积分10
20秒前
BINGBING1230发布了新的文献求助10
22秒前
焚天尘殇完成签到,获得积分10
23秒前
温柔柜子发布了新的文献求助10
25秒前
徐恺完成签到,获得积分10
27秒前
27秒前
harino发布了新的文献求助10
27秒前
28秒前
29秒前
王王瑶发布了新的文献求助10
29秒前
zuohe发布了新的文献求助10
29秒前
Fab4发布了新的文献求助10
30秒前
姜姜完成签到,获得积分10
31秒前
31秒前
等待吐司应助daodao采纳,获得10
31秒前
gbr0519发布了新的文献求助10
33秒前
33秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
On the Angular Distribution in Nuclear Reactions and Coincidence Measurements 1000
Vertébrés continentaux du Crétacé supérieur de Provence (Sud-Est de la France) 600
A complete Carnosaur Skeleton From Zigong, Sichuan- Yangchuanosaurus Hepingensis 四川自贡一完整肉食龙化石-和平永川龙 600
Le transsexualisme : étude nosographique et médico-légale (en PDF) 500
Elle ou lui ? Histoire des transsexuels en France 500
FUNDAMENTAL STUDY OF ADAPTIVE CONTROL SYSTEMS 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5312188
求助须知:如何正确求助?哪些是违规求助? 4455976
关于积分的说明 13864983
捐赠科研通 4344392
什么是DOI,文献DOI怎么找? 2385837
邀请新用户注册赠送积分活动 1380209
关于科研通互助平台的介绍 1348565