Accelerating reinforcement learning with case-based model-assisted experience augmentation for process control

强化学习 计算机科学 适应性 稳健性(进化) 过程(计算) 背景(考古学) 过程控制 控制工程 人工智能 控制(管理) 控制理论(社会学) 工程类 生物 生物化学 基因 操作系统 古生物学 化学 生态学
作者
Runze Lin,Junghui Chen,Lei Xie,Hongye Su
出处
期刊:Neural Networks [Elsevier BV]
卷期号:158: 197-215 被引量:10
标识
DOI:10.1016/j.neunet.2022.10.016
摘要

In the context of intelligent manufacturing in the process industry, traditional model-based optimization control methods cannot adapt to the situation of drastic changes in working conditions or operating modes. Reinforcement learning (RL) directly achieves the control objective by interacting with the environment, and has significant advantages in the presence of uncertainty since it does not require an explicit model of the operating plant. However, most RL algorithms fail to retain transfer learning capabilities in the presence of mode variation, which becomes a practical obstacle to industrial process control applications. To address these issues, we design a framework that uses local data augmentation to improve the training efficiency and transfer learning (adaptability) performance. Therefore, this paper proposes a novel RL control algorithm, CBR-MA-DDPG, organically integrating case-based reasoning (CBR), model-assisted (MA) experience augmentation, and deep deterministic policy gradient (DDPG). When the operating mode changes, CBR-MA-DDPG can quickly adapt to the varying environment and achieve the desired control performance within several training episodes. Experimental analyses on a continuous stirred tank reactor (CSTR) and an organic Rankine cycle (ORC) demonstrate the superiority of the proposed method in terms of both adaptability and control performance/robustness. The results show that the control performance of the CBR-MA-DDPG agent outperforms the conventional PI and MPC control schemes, and that it has higher training efficiency than the state-of-the-art DDPG, TD3, and PPO algorithms in transfer learning scenarios with mode shift situations.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
alvin完成签到,获得积分10
1秒前
Jenny发布了新的文献求助10
4秒前
木康薛完成签到,获得积分10
4秒前
nater2ver完成签到,获得积分10
4秒前
6秒前
好好完成签到,获得积分10
6秒前
斯文的芹菜完成签到 ,获得积分10
7秒前
souther完成签到,获得积分0
7秒前
7秒前
小谢完成签到,获得积分10
8秒前
tfsn20完成签到,获得积分0
8秒前
余健完成签到,获得积分10
8秒前
maxyer完成签到,获得积分10
10秒前
美好斓发布了新的文献求助10
11秒前
11秒前
12秒前
韭菜盒子发布了新的文献求助10
12秒前
小萝卜123发布了新的文献求助10
13秒前
毛哥看文献完成签到 ,获得积分10
15秒前
Ysn发布了新的文献求助10
16秒前
zzz完成签到,获得积分10
16秒前
毛舰完成签到 ,获得积分10
17秒前
Raine完成签到,获得积分10
17秒前
junio完成签到 ,获得积分10
17秒前
简单完成签到,获得积分10
17秒前
大模型应助韭菜盒子采纳,获得10
19秒前
张一完成签到,获得积分10
19秒前
三石完成签到,获得积分10
19秒前
李超完成签到,获得积分10
23秒前
1222333发布了新的文献求助10
24秒前
ice完成签到 ,获得积分10
24秒前
可靠月亮完成签到,获得积分10
25秒前
小潘完成签到 ,获得积分10
26秒前
Ysn完成签到,获得积分10
26秒前
蛋花肉圆汤完成签到,获得积分10
27秒前
充电宝应助liuzhen采纳,获得10
29秒前
和谐的冬莲完成签到 ,获得积分10
29秒前
31秒前
Jasper应助风生采纳,获得10
31秒前
高分求助中
Technologies supporting mass customization of apparel: A pilot project 600
Izeltabart tapatansine - AdisInsight 500
Chinesen in Europa – Europäer in China: Journalisten, Spione, Studenten 500
Arthur Ewert: A Life for the Comintern 500
China's Relations With Japan 1945-83: The Role of Liao Chengzhi // Kurt Werner Radtke 500
Two Years in Peking 1965-1966: Book 1: Living and Teaching in Mao's China // Reginald Hunt 500
Epigenetic Drug Discovery 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3815941
求助须知:如何正确求助?哪些是违规求助? 3359404
关于积分的说明 10402536
捐赠科研通 3077257
什么是DOI,文献DOI怎么找? 1690255
邀请新用户注册赠送积分活动 813667
科研通“疑难数据库(出版商)”最低求助积分说明 767743