Safe and Balanced: A Framework for Constrained Multi-Objective Reinforcement Learning

强化学习 人工智能 计算机科学 机器学习 数学优化 数学
作者
Shangding Gu,Bilgehan Sel,Yuhao Ding,Lu Wang,Qingwei Lin,Alois Knoll,Ming Jin
出处
期刊:IEEE Transactions on Pattern Analysis and Machine Intelligence [IEEE Computer Society]
卷期号:47 (5): 3322-3331 被引量:7
标识
DOI:10.1109/tpami.2025.3528944
摘要

In numerous reinforcement learning (RL) problems involving safety-critical systems, a key challenge lies in balancing multiple objectives while simultaneously meeting all stringent safety constraints. To tackle this issue, we propose a primal-based framework that orchestrates policy optimization between multi-objective learning and constraint adherence. Our method employs a novel natural policy gradient manipulation method to optimize multiple RL objectives and overcome conflicting gradients between different objectives, since the simple weighted average gradient direction may not be beneficial for specific objectives due to misaligned gradients of different objectives. When there is a violation of a hard constraint, our algorithm steps in to rectify the policy to minimize this violation. Particularly, We establish theoretical convergence and constraint violation guarantees, and our proposed method also outperforms prior state-of-the-art methods on challenging safe multi-objective RL tasks.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
日暮温柔应助yiyi采纳,获得10
1秒前
执念发布了新的文献求助10
1秒前
2秒前
FF完成签到,获得积分10
2秒前
2秒前
liuzhanyu发布了新的文献求助10
3秒前
yu发布了新的文献求助10
3秒前
WYN完成签到,获得积分10
3秒前
123完成签到,获得积分20
3秒前
金蛋蛋完成签到 ,获得积分10
3秒前
4秒前
852应助haha采纳,获得10
4秒前
5秒前
6秒前
123发布了新的文献求助10
7秒前
莓小鱼完成签到,获得积分10
8秒前
俏皮的绿竹完成签到,获得积分20
8秒前
大力的灵雁应助温木成林采纳,获得10
8秒前
8秒前
8秒前
希望天下0贩的0应助Lore采纳,获得10
9秒前
Liu完成签到,获得积分20
9秒前
虚拟的绮晴完成签到,获得积分10
9秒前
yummy发布了新的文献求助10
9秒前
9秒前
10秒前
10秒前
唐唐应助Ashan采纳,获得10
11秒前
愉快千凝发布了新的文献求助10
12秒前
XQQDD发布了新的文献求助10
13秒前
LeeYoo发布了新的文献求助10
14秒前
15秒前
16秒前
曾志伟发布了新的文献求助30
16秒前
研友_8y2o0L发布了新的文献求助10
16秒前
haha发布了新的文献求助10
18秒前
20秒前
Mask发布了新的文献求助10
20秒前
jawa完成签到 ,获得积分10
21秒前
22秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Picture this! Including first nations fiction picture books in school library collections 2000
The Cambridge History of China: Volume 4, Sui and T'ang China, 589–906 AD, Part Two 1500
Cowries - A Guide to the Gastropod Family Cypraeidae 1200
ON THE THEORY OF BIRATIONAL BLOWING-UP 666
Signals, Systems, and Signal Processing 610
Chemistry and Physics of Carbon Volume 15 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6388684
求助须知:如何正确求助?哪些是违规求助? 8203020
关于积分的说明 17356848
捐赠科研通 5442239
什么是DOI,文献DOI怎么找? 2877912
邀请新用户注册赠送积分活动 1854294
关于科研通互助平台的介绍 1697825