清晨好,您是今天最早来到科研通的研友!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您科研之路漫漫前行!

A general deep reinforcement learning hyperheuristic framework for solving combinatorial optimization problems

强化学习 启发式 启发式 人工智能 数学优化 选择(遗传算法) 元启发式 计算机科学 机器学习 组合优化 超启发式 过程(计算) 数学 操作系统 机器人 移动机器人 机器人学习
作者
Jakob Vigerust Kallestad,Ramin Hasibi,Ahmad Hemmati,Kenneth Sörensen
出处
期刊:European Journal of Operational Research [Elsevier BV]
卷期号:309 (1): 446-468 被引量:36
标识
DOI:10.1016/j.ejor.2023.01.017
摘要

Many problem-specific heuristic frameworks have been developed to solve combinatorial optimization problems, but these frameworks do not generalize well to other problem domains. Metaheuristic frameworks aim to be more generalizable compared to traditional heuristics, however their performances suffer from poor selection of low-level heuristics (operators) during the search process. An example of heuristic selection in a metaheuristic framework is the adaptive layer of the popular framework of Adaptive Large Neighborhood Search (ALNS). Here, we propose a selection hyperheuristic framework that uses Deep Reinforcement Learning (Deep RL) as an alternative to the adaptive layer of ALNS. Unlike the adaptive layer which only considers heuristics’ past performance for future selection, a Deep RL agent is able to take into account additional information from the search process, e.g., the difference in objective value between iterations, to make better decisions. This is due to the representation power of Deep Learning methods and the decision making capability of the Deep RL agent which can learn to adapt to different problems and instance characteristics. In this paper, by integrating the Deep RL agent into the ALNS framework, we introduce Deep Reinforcement Learning Hyperheuristic (DRLH), a general framework for solving a wide variety of combinatorial optimization problems and show that our framework is better at selecting low-level heuristics at each step of the search process compared to ALNS and a Uniform Random Selection (URS). Our experiments also show that while ALNS can not properly handle a large pool of heuristics, DRLH is not negatively affected by increasing the number of heuristics.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
智者雨人完成签到 ,获得积分10
11秒前
刘玲完成签到 ,获得积分10
30秒前
limerencevie完成签到 ,获得积分10
39秒前
嘻嘻哈哈应助GG采纳,获得10
51秒前
彩色的芷容完成签到 ,获得积分10
51秒前
免疫小白完成签到 ,获得积分10
58秒前
1分钟前
森源海完成签到,获得积分10
1分钟前
蒋紫妍发布了新的文献求助10
1分钟前
合不着完成签到 ,获得积分10
1分钟前
Ttimer完成签到,获得积分10
1分钟前
从来都不会放弃zr完成签到,获得积分10
2分钟前
公西翠萱完成签到 ,获得积分10
2分钟前
秋半梦完成签到,获得积分10
2分钟前
3分钟前
3分钟前
freebound发布了新的文献求助10
3分钟前
乐乐应助freebound采纳,获得10
3分钟前
韩明轩完成签到 ,获得积分10
3分钟前
蒋紫妍发布了新的文献求助10
3分钟前
dydydyd完成签到,获得积分10
3分钟前
zxdw完成签到,获得积分10
3分钟前
Zhangll完成签到,获得积分10
3分钟前
小山己几完成签到,获得积分10
3分钟前
X519664508完成签到,获得积分0
4分钟前
哈哈哈完成签到 ,获得积分10
4分钟前
铜豌豆完成签到 ,获得积分10
4分钟前
蒋紫妍完成签到,获得积分10
4分钟前
踏雪完成签到,获得积分10
4分钟前
涛1完成签到 ,获得积分10
4分钟前
sonicker完成签到 ,获得积分10
5分钟前
Imstemcell完成签到,获得积分10
5分钟前
TUTU完成签到 ,获得积分10
5分钟前
激动的似狮完成签到,获得积分0
5分钟前
5分钟前
木南完成签到 ,获得积分10
6分钟前
1437594843完成签到 ,获得积分0
6分钟前
GMEd1son完成签到,获得积分10
6分钟前
JLB完成签到 ,获得积分10
6分钟前
王贤平完成签到,获得积分10
6分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Lewis’s Child and Adolescent Psychiatry: A Comprehensive Textbook Sixth Edition 2000
Continuing Syntax 1000
Encyclopedia of Quaternary Science Reference Work • Third edition • 2025 800
Signals, Systems, and Signal Processing 510
Pharma R&D Annual Review 2026 500
荧光膀胱镜诊治膀胱癌 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6218419
求助须知:如何正确求助?哪些是违规求助? 8043539
关于积分的说明 16765523
捐赠科研通 5304813
什么是DOI,文献DOI怎么找? 2826291
邀请新用户注册赠送积分活动 1804328
关于科研通互助平台的介绍 1664315