亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

A deep reinforcement learning hyper-heuristic with feature fusion for online packing problems

强化学习 计算机科学 启发式 启发式 人工智能 包装问题 背包问题 班级(哲学) 机器学习 特征(语言学) 超启发式 数学优化 算法 数学 操作系统 机器人 哲学 语言学 机器人学习 移动机器人
作者
Chaofan Tu,Ruibin Bai,Uwe Aickelin,Yuchang Zhang,Heshan Du
出处
期刊:Expert Systems With Applications [Elsevier]
卷期号:230: 120568-120568 被引量:6
标识
DOI:10.1016/j.eswa.2023.120568
摘要

In recent years, deep reinforcement learning has shown great potential in solving computer games with sequential decision-making scenarios. Hyper-heuristic is a generic search framework, capable of intelligently selecting or generating algorithms to solve a class of optimisation problems with stochastic or dynamic settings. This paper proposes a new general framework for solving online packing problems using deep reinforcement learning hyper-heuristics. Although analytical approaches can address most offline packing problems successfully, their online versions have proved much more challenging and the performance of the existing methods is often not satisfactory. In this paper, we extend a recent deep reinforcement learning hyper-heuristic framework by fusing the visual information of real-time packing with distributional information of random parameters of the problem. Computational experiments show that our method outperforms the state of the art online methods with reductions in optimality gap between 2%–19% for knapsack problem and 0.7% for the online strip packing problem. In addition, a new visual analysis presentation is also devised to better interpret the learned packing strategies, which can reveal more information than the widely used landscape analysis. As online packing problems are widely available in production environments, the proposed approach can serve as an important reference to solve other similar combinatorial optimisation problems for which visual layout inputs would aid learning.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
smh完成签到,获得积分10
1秒前
隐形曼青应助ajiaxi采纳,获得10
6秒前
yangyog完成签到,获得积分10
7秒前
小蘑菇应助ych62524采纳,获得10
8秒前
yangyog发布了新的文献求助10
12秒前
希望天下0贩的0应助pigpig采纳,获得10
16秒前
高高代珊完成签到 ,获得积分10
22秒前
25秒前
26秒前
原味鸡完成签到 ,获得积分10
29秒前
褚明雪完成签到 ,获得积分10
29秒前
jjdeng发布了新的文献求助10
30秒前
江小霜发布了新的文献求助10
37秒前
77完成签到 ,获得积分10
37秒前
斯文的凝珍完成签到,获得积分10
43秒前
50秒前
wangch198201完成签到 ,获得积分10
54秒前
56秒前
56秒前
1分钟前
lucky发布了新的文献求助10
1分钟前
神内小天使完成签到,获得积分10
1分钟前
hello2001完成签到 ,获得积分10
1分钟前
1分钟前
东方天奇完成签到 ,获得积分10
1分钟前
xiw完成签到,获得积分10
1分钟前
1分钟前
简单的沛蓝完成签到 ,获得积分10
1分钟前
陶醉觅夏发布了新的文献求助10
1分钟前
orixero应助hy采纳,获得10
1分钟前
NexusExplorer应助科研通管家采纳,获得20
1分钟前
汉堡包应助科研通管家采纳,获得10
1分钟前
1分钟前
lxyonline发布了新的文献求助10
1分钟前
在水一方应助napnap采纳,获得10
1分钟前
2分钟前
2分钟前
2分钟前
hy发布了新的文献求助10
2分钟前
2分钟前
高分求助中
Sustainable Land Management: Strategies to Cope with the Marginalisation of Agriculture 1000
Corrosion and Oxygen Control 600
Yaws' Handbook of Antoine coefficients for vapor pressure 500
Python Programming for Linguistics and Digital Humanities: Applications for Text-Focused Fields 500
Love and Friendship in the Western Tradition: From Plato to Postmodernity 500
行動データの計算論モデリング 強化学習モデルを例として 500
Johann Gottlieb Fichte: Die späten wissenschaftlichen Vorlesungen / IV,1: ›Transzendentale Logik I (1812)‹ 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2556548
求助须知:如何正确求助?哪些是违规求助? 2180311
关于积分的说明 5623603
捐赠科研通 1901665
什么是DOI,文献DOI怎么找? 949942
版权声明 565607
科研通“疑难数据库(出版商)”最低求助积分说明 504846