Robust Risk-Aware Reinforcement Learning

强化学习 数学优化 下行风险 计算机科学 稳健优化 投资组合优化 文件夹 套利 最优化问题 人工智能 稳健性(进化) 数学 经济 财务 化学 基因 生物化学
作者
Sebastian Jaimungal,Silvana M. Pesenti,Ye Sheng Wang,Hariom Tatsat
出处
期刊:Siam Journal on Financial Mathematics [Society for Industrial and Applied Mathematics]
卷期号:13 (1): 213-226 被引量:11
标识
DOI:10.1137/21m144640x
摘要

We present a reinforcement learning (RL) approach for robust optimization of risk-aware performance criteria. To allow agents to express a wide variety of risk-reward profiles, we assess the value of a policy using rank dependent expected utility (RDEU). RDEU allows agents to seek gains, while simultaneously protecting themselves against downside risk. To robustify optimal policies against model uncertainty, we assess a policy not by its distribution but rather by the worst possible distribution that lies within a Wasserstein ball around it. Thus, our problem formulation may be viewed as an actor/agent choosing a policy (the outer problem) and the adversary then acting to worsen the performance of that strategy (the inner problem). We develop explicit policy gradient formulae for the inner and outer problems and show their efficacy on three prototypical financial problems: robust portfolio allocation, benchmark optimization, and statistical arbitrage.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
蔡蔡完成签到 ,获得积分10
刚刚
英姑应助奶冻采纳,获得10
2秒前
satchzhao发布了新的文献求助10
2秒前
Duckseid完成签到,获得积分10
3秒前
ZY完成签到 ,获得积分10
5秒前
吴老四发布了新的文献求助10
5秒前
Amy完成签到,获得积分10
5秒前
ymxlcfc完成签到 ,获得积分10
9秒前
zhuzhu完成签到,获得积分10
9秒前
FashionBoy应助yoozii采纳,获得10
11秒前
与淇完成签到,获得积分10
11秒前
经纲完成签到 ,获得积分0
13秒前
jojo完成签到 ,获得积分10
15秒前
maclogos发布了新的文献求助10
15秒前
无尘完成签到 ,获得积分10
17秒前
进击的研狗完成签到 ,获得积分10
17秒前
细雨听风完成签到,获得积分10
19秒前
略略略完成签到 ,获得积分10
19秒前
only完成签到 ,获得积分10
20秒前
油麦菜完成签到 ,获得积分10
21秒前
MAKEYF完成签到 ,获得积分10
21秒前
黑粉头头完成签到,获得积分10
22秒前
小嚣张完成签到,获得积分10
24秒前
修水县1个科研人完成签到 ,获得积分10
25秒前
27秒前
27秒前
Springgg完成签到,获得积分10
28秒前
28秒前
29秒前
慧喆完成签到 ,获得积分10
29秒前
知非完成签到 ,获得积分10
30秒前
31秒前
knn完成签到,获得积分10
32秒前
Solar energy发布了新的文献求助10
32秒前
32秒前
铭名洺完成签到 ,获得积分10
33秒前
柠檬完成签到 ,获得积分10
33秒前
不认识发布了新的文献求助10
33秒前
33秒前
高分求助中
Technologies supporting mass customization of apparel: A pilot project 600
Introduction to Strong Mixing Conditions Volumes 1-3 500
Tip60 complex regulates eggshell formation and oviposition in the white-backed planthopper, providing effective targets for pest control 400
A Field Guide to the Amphibians and Reptiles of Madagascar - Frank Glaw and Miguel Vences - 3rd Edition 400
China Gadabouts: New Frontiers of Humanitarian Nursing, 1941–51 400
The Healthy Socialist Life in Maoist China, 1949–1980 400
Walking a Tightrope: Memories of Wu Jieping, Personal Physician to China's Leaders 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3798557
求助须知:如何正确求助?哪些是违规求助? 3344128
关于积分的说明 10318663
捐赠科研通 3060696
什么是DOI,文献DOI怎么找? 1679782
邀请新用户注册赠送积分活动 806769
科研通“疑难数据库(出版商)”最低求助积分说明 763353