Physics-informed reinforcement learning optimization of nuclear assembly design

强化学习 计算机科学 还原(数学) 人工智能 最优化问题 组合优化 嵌入 算法 数学 几何学
作者
Majdi I. Radaideh,Isaac Wolverton,Joshua Joseph,James Tusar,Uuganbayar Otgonbaatar,Nicholas Roy,Benoit Forget,Koroush Shirvan
出处
期刊:Nuclear Engineering and Design [Elsevier BV]
卷期号:372: 110966-110966 被引量:62
标识
DOI:10.1016/j.nucengdes.2020.110966
摘要

Optimization of nuclear fuel assemblies if performed effectively, will lead to fuel efficiency improvement, cost reduction, and safety assurance. However, assembly optimization involves solving high-dimensional and computationally expensive combinatorial problems. As such, fuel designers’ expert judgement has commonly prevailed over the use of stochastic optimization (SO) algorithms such as genetic algorithms and simulated annealing. To improve the state-of-art, we explore a class of artificial intelligence (AI) algorithms, namely, reinforcement learning (RL) in this work. We propose a physics-informed AI optimization methodology by establishing a connection through reward shaping between RL and the tactics fuel designers follow in practice by moving fuel rods in the assembly to meet specific constraints and objectives. The methodology utilizes RL algorithms, deep Q learning and proximal policy optimization, and compares their performance to SO algorithms. The methodology is applied on two boiling water reactor assemblies of low-dimensional ( ∼ 2 × 10 6 combinations) and high-dimensional ( ∼ 10 31 combinations) natures. The results demonstrate that RL is more effective than SO in solving high dimensional problems, i.e., 10 × 10 assembly, through embedding expert knowledge in form of game rules and effectively exploring the search space. For a given computational resources and timeframe relevant to fuel designers, RL algorithms outperformed SO through finding more feasible patterns, 4–5 times more than SO, and through increasing search speed, as indicated by the RL outstanding computational efficiency. The results of this work clearly demonstrate RL effectiveness as another decision support tool for nuclear fuel assembly optimization.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
墨染完成签到 ,获得积分10
1秒前
小胖完成签到 ,获得积分10
1秒前
李李李完成签到 ,获得积分10
5秒前
小刺猬完成签到,获得积分10
5秒前
晓风残月完成签到 ,获得积分10
6秒前
BAEK完成签到,获得积分10
8秒前
方方完成签到 ,获得积分10
8秒前
路先生完成签到,获得积分10
8秒前
btcat完成签到,获得积分0
9秒前
研ZZ发布了新的文献求助10
14秒前
tong童完成签到 ,获得积分10
14秒前
白熊完成签到 ,获得积分10
15秒前
胡德完成签到 ,获得积分10
21秒前
songyu完成签到,获得积分10
25秒前
许鸽完成签到,获得积分10
26秒前
8D完成签到,获得积分10
29秒前
i2stay完成签到,获得积分0
31秒前
gycao2025完成签到,获得积分10
31秒前
科研顺利完成签到,获得积分10
34秒前
36秒前
633完成签到 ,获得积分10
43秒前
yiyi发布了新的文献求助10
44秒前
2316690509完成签到 ,获得积分10
45秒前
乐观的箭头完成签到,获得积分10
45秒前
ash完成签到 ,获得积分10
46秒前
越野蟹完成签到,获得积分10
48秒前
幸福妙柏完成签到 ,获得积分10
54秒前
青梅葡萄汁完成签到 ,获得积分10
58秒前
huhu完成签到,获得积分10
59秒前
一行白鹭上青天完成签到 ,获得积分10
1分钟前
沁雪完成签到 ,获得积分10
1分钟前
辛勤的囧完成签到,获得积分10
1分钟前
666星爷完成签到,获得积分10
1分钟前
我要读博士完成签到 ,获得积分10
1分钟前
1797472009完成签到 ,获得积分10
1分钟前
qiongqiong完成签到 ,获得积分10
1分钟前
yiyi完成签到,获得积分10
1分钟前
soob完成签到 ,获得积分10
1分钟前
曹飒丽完成签到 ,获得积分10
1分钟前
waswas完成签到,获得积分10
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Leading Academic-Practice Partnerships in Nursing and Healthcare: A Paradigm for Change 800
Signals, Systems, and Signal Processing 610
Research Methods for Business: A Skill Building Approach, 9th Edition 500
Research Methods for Applied Linguistics 500
Picture Books with Same-sex Parented Families Unintentional Censorship 444
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6414019
求助须知:如何正确求助?哪些是违规求助? 8232681
关于积分的说明 17476653
捐赠科研通 5466703
什么是DOI,文献DOI怎么找? 2888499
邀请新用户注册赠送积分活动 1865299
关于科研通互助平台的介绍 1703234