清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

Defending Federated Large Language Models against Data Poisoning Attacks: A Safety-Aware Framework

计算机科学 计算机安全
作者
Wallace Cruz,J. G. Correia,Allan Douglas Bento da Costa
标识
DOI:10.36227/techrxiv.175979271.17695501/v1
摘要

Federated learning (FL) has recently emerged as a promising paradigm for training large language models (LLMs) across distributed clients without centralizing raw data, thus enhancing privacy and regulatory compliance. However, the distributed and heterogeneous nature of FL also introduces critical security vulnerabilities. Among them, data poisoning attacks constitute a particularly insidious threat: malicious clients can inject carefully crafted samples into local datasets, undermining the safety alignment of LLMs or embedding backdoors that are activated under specific prompts. While prior research has proposed robust aggregation, anomaly detection, and post-hoc sanitization methods, existing defenses show limited effectiveness in non-independent and identically distributed (non-IID) environments, especially when adversaries launch stealthy clean-label attacks that directly target safety objectives. This paper introduces SafeFedPoisonDef, a multi-layer defense framework combining client update anomaly detection, reliability-weighted robust aggregation, and post-hoc fine-tuning on trusted safety datasets. We formalize the threat model, present a mathematical formulation, and provide a reproducible evaluation using federated instruction-tuning scenarios for LLMs. Results demonstrate that SafeFedPoisonDef reduces safety violation rates by up to 65% compared with state-of-the-art baselines while preserving utility under diverse poisoning intensities. We also examine compliance with LGPD, GDPR, and emerging standards for AI safety. The findings highlight the feasibility of resilient and legally responsible federated LLM training in critical applications.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
2秒前
菠萝包完成签到 ,获得积分10
5秒前
mayocoh发布了新的文献求助10
5秒前
9秒前
share完成签到 ,获得积分10
24秒前
Hello应助nfei采纳,获得10
43秒前
senpl发布了新的文献求助10
1分钟前
科研通AI2S应助senpl采纳,获得30
1分钟前
senpl完成签到,获得积分10
1分钟前
nfei完成签到,获得积分10
1分钟前
家迎松发布了新的文献求助10
1分钟前
1分钟前
摸鱼真君发布了新的文献求助10
1分钟前
家迎松完成签到,获得积分10
1分钟前
两个榴莲完成签到,获得积分0
2分钟前
无情听南完成签到,获得积分10
2分钟前
Chen完成签到 ,获得积分10
2分钟前
瑾沫流年应助senpl采纳,获得10
2分钟前
ZXneuro完成签到,获得积分10
3分钟前
Wei发布了新的文献求助10
3分钟前
名侦探柯基完成签到 ,获得积分10
3分钟前
aoxianghuang发布了新的文献求助10
3分钟前
3分钟前
xyz应助ZXneuro采纳,获得50
4分钟前
4分钟前
呐呐呐呐呐呐完成签到,获得积分10
4分钟前
狂野的含烟完成签到 ,获得积分10
5分钟前
鈮宝完成签到 ,获得积分10
5分钟前
李健的粉丝团团长应助Bo采纳,获得10
5分钟前
激动的似狮完成签到,获得积分10
5分钟前
5分钟前
Miss-Li完成签到,获得积分20
5分钟前
5分钟前
瘦瘦的枫叶完成签到 ,获得积分10
5分钟前
Miss-Li发布了新的文献求助10
5分钟前
Willy完成签到,获得积分10
5分钟前
Bo发布了新的文献求助10
5分钟前
Bo完成签到,获得积分10
6分钟前
fufufu123完成签到 ,获得积分10
6分钟前
pegasus0802完成签到,获得积分10
7分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Einführung in die Rechtsphilosophie und Rechtstheorie der Gegenwart 1500
Binary Alloy Phase Diagrams, 2nd Edition 1000
Air Transportation A Global Management Perspective 9th Edition 700
DESIGN GUIDE FOR SHIPBOARD AIRBORNE NOISE CONTROL 600
NMR in Plants and Soils: New Developments in Time-domain NMR and Imaging 600
当代中国马克思主义问题意识研究 科学出版社 500
热门求助领域 (近24小时)
化学 医学 生物 材料科学 工程类 有机化学 内科学 生物化学 物理 计算机科学 纳米技术 遗传学 基因 复合材料 化学工程 物理化学 病理 催化作用 免疫学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 4974351
求助须知:如何正确求助?哪些是违规求助? 4229504
关于积分的说明 13172699
捐赠科研通 4018696
什么是DOI,文献DOI怎么找? 2199023
邀请新用户注册赠送积分活动 1211601
关于科研通互助平台的介绍 1126974