Design Synthesis Through a Markov Decision Process and Reinforcement Learning Framework

强化学习 马尔可夫决策过程 计算机科学 数学优化 背景(考古学) 部分可观测马尔可夫决策过程 马尔可夫链 马尔可夫过程 工程设计过程 过程(计算) 机器学习 马尔可夫模型 数学 工程类 机械工程 古生物学 统计 生物 操作系统
作者
Maximilian E. Ororbia,Gordon P. Warn
出处
期刊:Journal of Computing and Information Science in Engineering [ASM International]
卷期号:22 (2) 被引量:27
标识
DOI:10.1115/1.4051598
摘要

Abstract This article presents a framework that mathematically models optimal design synthesis as a Markov Decision Process (MDP) that is solved with reinforcement learning. In this context, the states correspond to specific design configurations, the actions correspond to the available alterations modeled after generative design grammars, and the immediate rewards are constructed to be related to the improvement in the altered configuration’s performance with respect to the design objective. Since in the context of optimal design synthesis the immediate rewards are in general not known at the onset of the process, reinforcement learning is employed to efficiently solve the MDP. The goal of the reinforcement learning agent is to maximize the cumulative rewards and hence synthesize the best performing or optimal design. The framework is demonstrated for the optimization of planar trusses with binary cross-sectional areas, and its utility is investigated with four numerical examples, each with a unique combination of domain, constraint, and external force(s) considering both linear-elastic and elastic-plastic material behaviors. The design solutions obtained with the framework are also compared with other methods in order to demonstrate its efficiency and accuracy.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
1秒前
华仔应助LL采纳,获得10
1秒前
七月完成签到,获得积分10
1秒前
我是老大应助六个核桃采纳,获得10
1秒前
2秒前
秦时明月完成签到,获得积分20
2秒前
英姑应助暗能量采纳,获得10
3秒前
情怀应助大力的诗蕾采纳,获得10
4秒前
4秒前
abc1122完成签到,获得积分10
4秒前
11关注了科研通微信公众号
5秒前
5秒前
6秒前
木木木发布了新的文献求助10
6秒前
赵雪萌发布了新的文献求助10
6秒前
6秒前
6秒前
9秒前
科研通AI6.2应助jinmai采纳,获得10
9秒前
shijin135完成签到,获得积分10
10秒前
科研通AI6.2应助小水滴采纳,获得50
10秒前
我有一头小毛驴完成签到,获得积分10
11秒前
11秒前
小夏发布了新的文献求助10
11秒前
欧耶欧椰完成签到 ,获得积分10
11秒前
11秒前
2blixiang关注了科研通微信公众号
12秒前
12秒前
稳重蜗牛完成签到,获得积分10
13秒前
FashionBoy应助没有ID采纳,获得10
13秒前
科研通AI6.4应助赵雪萌采纳,获得10
13秒前
可乐发布了新的文献求助10
14秒前
14秒前
16秒前
暗能量发布了新的文献求助10
16秒前
17秒前
小s发布了新的文献求助10
17秒前
奋斗的Yang完成签到,获得积分10
17秒前
18秒前
18秒前
高分求助中
The Wiley Blackwell Companion to Diachronic and Historical Linguistics 3000
HANDBOOK OF CHEMISTRY AND PHYSICS 106th edition 1000
ASPEN Adult Nutrition Support Core Curriculum, Fourth Edition 1000
Decentring Leadership 800
Signals, Systems, and Signal Processing 610
脑电大模型与情感脑机接口研究--郑伟龙 500
Genera Orchidacearum Volume 4: Epidendroideae, Part 1 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6288975
求助须知:如何正确求助?哪些是违规求助? 8107491
关于积分的说明 16960750
捐赠科研通 5353815
什么是DOI,文献DOI怎么找? 2844927
邀请新用户注册赠送积分活动 1822193
关于科研通互助平台的介绍 1678213