A deep multi-agent reinforcement learning approach to solve dynamic job shop scheduling problem

强化学习 计算机科学 动态优先级调度 调度(生产过程) 两级调度 公平份额计划 流水车间调度 单调速率调度 分布式计算 作业车间调度 固定优先级先发制人调度 循环调度 人工智能 工业工程 数学优化 计算机网络 工程类 数学 布线(电子设计自动化) 服务质量
作者
Renke Liu,Rajesh Piplani,Carlos Toro
出处
期刊:Computers & Operations Research [Elsevier]
卷期号:159: 106294-106294 被引量:2
标识
DOI:10.1016/j.cor.2023.106294
摘要

Manufacturing industry is experiencing a revolution in the creation and utilization of data, the abundance of industrial data creates a need for data-driven techniques to implement real-time production scheduling. In addition, existing dynamic scheduling techniques have been mainly developed to solve problems of invariable size, and are incapable of addressing the increasing volatility and complexity of practical production scheduling problems. To facilitate near real-time decision-making on the shop floor, we propose a deep multi-agent reinforcement learning-based approach to solve the dynamic job shop scheduling problem. Double deep Q-network algorithm, attached to decentralized scheduling agents, is used to learn the relationships between production information and scheduling objectives, and to make near real-time scheduling decisions. Proposed framework utilizes centralized training and decentralized execution scheme and parameter-sharing technique to tackle the non-stationary problem in the multi-agent reinforcement learning task. Several enhancements are also developed, including the novel state and action representation that can handle size-agnostic dynamic scheduling problems, a chronological joint-action framework to alleviate the credit-assignment difficulty, and knowledge-based reward-shaping techniques to encourage cooperation. Simulation study shows that the proposed architecture significantly improves the learning effectiveness, and delivers superior performance compared to existing scheduling strategies and state-of-the-art deep reinforcement learning-based dynamic scheduling approaches.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
lbt1686666发布了新的文献求助10
4秒前
醉熏的伊完成签到,获得积分10
8秒前
shiney完成签到 ,获得积分10
8秒前
王科研完成签到,获得积分10
9秒前
LYDZ1完成签到,获得积分10
11秒前
闪闪的从梦完成签到,获得积分10
11秒前
田様应助lbt1686666采纳,获得10
14秒前
16秒前
无花果应助张军采纳,获得10
21秒前
踏实的白羊完成签到,获得积分10
22秒前
SOLOMON应助Grace采纳,获得10
22秒前
化学小学生完成签到,获得积分10
24秒前
24秒前
24秒前
Monica完成签到,获得积分10
28秒前
Cheng完成签到 ,获得积分10
29秒前
苗笑卉发布了新的文献求助10
31秒前
futianyu完成签到 ,获得积分10
31秒前
33秒前
张军发布了新的文献求助10
38秒前
思源应助川农辅导员采纳,获得10
39秒前
梦_筱彩完成签到 ,获得积分10
41秒前
苗笑卉驳回了SCQ应助
41秒前
香蕉觅云应助科研通管家采纳,获得10
44秒前
川农辅导员完成签到,获得积分10
47秒前
zorro3574完成签到,获得积分10
49秒前
51秒前
科研垃圾发布了新的文献求助30
54秒前
聪明的宛菡完成签到,获得积分10
58秒前
兴奋晓灵完成签到,获得积分10
1分钟前
星芋啵啵完成签到 ,获得积分10
1分钟前
苗笑卉完成签到,获得积分10
1分钟前
gjww应助秘书处堂采纳,获得10
1分钟前
英俊的铭应助欣欣采纳,获得10
1分钟前
乐乐应助几米杨采纳,获得10
1分钟前
1分钟前
jj完成签到 ,获得积分10
1分钟前
1分钟前
nenenn发布了新的文献求助10
1分钟前
departure完成签到,获得积分10
1分钟前
高分求助中
请在求助之前详细阅读求助说明!!!! 20000
Sphäroguß als Werkstoff für Behälter zur Beförderung, Zwischen- und Endlagerung radioaktiver Stoffe - Untersuchung zu alternativen Eignungsnachweisen: Zusammenfassender Abschlußbericht 1500
One Man Talking: Selected Essays of Shao Xunmei, 1929–1939 1000
Yuwu Song, Biographical Dictionary of the People's Republic of China 700
[Lambert-Eaton syndrome without calcium channel autoantibodies] 520
The Three Stars Each: The Astrolabes and Related Texts 500
A radiographic standard of reference for the growing knee 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2468905
求助须知:如何正确求助?哪些是违规求助? 2136223
关于积分的说明 5442926
捐赠科研通 1860799
什么是DOI,文献DOI怎么找? 925477
版权声明 562694
科研通“疑难数据库(出版商)”最低求助积分说明 495093