Reinforcement learning for continuous-time mean-variance portfolio selection in a regime-switching market

强化学习 贝尔曼方程 不可见的 文件夹 数学优化 随机控制 最优控制 数学 计算机科学 经济 计量经济学 人工智能 财务
作者
Bo Wu,Lingfei Li
出处
期刊:Journal of Economic Dynamics and Control [Elsevier BV]
卷期号:158: 104787-104787
标识
DOI:10.1016/j.jedc.2023.104787
摘要

We propose a reinforcement learning (RL) approach to solve the continuous-time mean-variance portfolio selection problem in a regime-switching market, where the market regime is unobservable. To encourage exploration for learning, we formulate an exploratory stochastic control problem with an entropy-regularized mean-variance objective. We obtain semi-analytical representations of the optimal value function and optimal policy, which involve unknown solutions to two linear parabolic partial differential equations (PDEs). We utilize these representations to parametrize the value function and policy for learning with the unknown solutions to the PDEs approximated based on polynomials. We develop an actor-critic RL algorithm to learn the optimal policy through interactions with the market environment. The algorithm carries out filtering to obtain the belief probability of the market regime and performs policy evaluation and policy gradient updates alternately. Empirical results demonstrate the advantages of our RL algorithm in relatively long-term investment problems over the classical control approach and an RL algorithm developed for the continuous-time mean-variance problem without considering regime switches.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
1秒前
火星上的诗兰完成签到,获得积分10
2秒前
科研通AI6.4应助Juliet采纳,获得10
2秒前
不可可kk完成签到,获得积分20
4秒前
In发布了新的文献求助10
4秒前
飘逸秋荷发布了新的文献求助10
5秒前
6秒前
阿泽完成签到,获得积分10
7秒前
wangtao发布了新的文献求助10
7秒前
斯文败类应助Likee采纳,获得10
8秒前
专一的凛完成签到,获得积分10
8秒前
ding应助言言采纳,获得10
8秒前
9秒前
共享精神应助优美猕猴桃采纳,获得10
9秒前
Lucas应助cyuan采纳,获得10
9秒前
lqy完成签到,获得积分10
9秒前
宋呵呵完成签到,获得积分10
10秒前
小菜鸟完成签到,获得积分10
11秒前
王一完成签到,获得积分10
11秒前
solarmat完成签到,获得积分10
11秒前
wangtao完成签到,获得积分10
13秒前
14秒前
yyy完成签到,获得积分20
14秒前
huyux完成签到,获得积分10
14秒前
14秒前
15秒前
卫某完成签到,获得积分10
15秒前
农大汪汪完成签到,获得积分10
15秒前
和平发展完成签到,获得积分0
16秒前
zhangyida完成签到,获得积分10
17秒前
ping777755完成签到,获得积分10
17秒前
DKJ应助光亮战斗机采纳,获得10
19秒前
19秒前
子衿发布了新的文献求助10
19秒前
酷酷酷完成签到,获得积分10
19秒前
田様应助jj采纳,获得30
19秒前
Iridescent发布了新的文献求助10
20秒前
20秒前
小蘑菇应助科研通管家采纳,获得10
20秒前
高分求助中
GL 2 A method for assessing the in-place cleanability of food processing equipment, Fourth Edition, December 2023 3000
Annie Ernaux: De la perte au corps glorieux 600
Writing Systems 500
Media Today Mass Communication in a Converging World 9th Edition 400
Understanding Modeling and Simulation of Polymerization Reactions 400
Invited Discussant 63O and 64O 400
A revision of Limenitis helmanni and its related species (Nymphalidae) from Central and South China 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6834599
求助须知:如何正确求助?哪些是违规求助? 8544648
关于积分的说明 18179827
捐赠科研通 6179694
什么是DOI,文献DOI怎么找? 3037941
关于科研通互助平台的介绍 2024791
邀请新用户注册赠送积分活动 2015089