A general deep reinforcement learning hyperheuristic framework for solving combinatorial optimization problems

强化学习 启发式 启发式 人工智能 数学优化 选择(遗传算法) 元启发式 计算机科学 机器学习 组合优化 超启发式 过程(计算) 数学 机器人 移动机器人 操作系统 机器人学习
作者
Jakob Vigerust Kallestad,Ramin Hasibi,Ahmad Hemmati,Kenneth Sörensen
出处
期刊:European Journal of Operational Research [Elsevier BV]
卷期号:309 (1): 446-468 被引量:36
标识
DOI:10.1016/j.ejor.2023.01.017
摘要

Many problem-specific heuristic frameworks have been developed to solve combinatorial optimization problems, but these frameworks do not generalize well to other problem domains. Metaheuristic frameworks aim to be more generalizable compared to traditional heuristics, however their performances suffer from poor selection of low-level heuristics (operators) during the search process. An example of heuristic selection in a metaheuristic framework is the adaptive layer of the popular framework of Adaptive Large Neighborhood Search (ALNS). Here, we propose a selection hyperheuristic framework that uses Deep Reinforcement Learning (Deep RL) as an alternative to the adaptive layer of ALNS. Unlike the adaptive layer which only considers heuristics’ past performance for future selection, a Deep RL agent is able to take into account additional information from the search process, e.g., the difference in objective value between iterations, to make better decisions. This is due to the representation power of Deep Learning methods and the decision making capability of the Deep RL agent which can learn to adapt to different problems and instance characteristics. In this paper, by integrating the Deep RL agent into the ALNS framework, we introduce Deep Reinforcement Learning Hyperheuristic (DRLH), a general framework for solving a wide variety of combinatorial optimization problems and show that our framework is better at selecting low-level heuristics at each step of the search process compared to ALNS and a Uniform Random Selection (URS). Our experiments also show that while ALNS can not properly handle a large pool of heuristics, DRLH is not negatively affected by increasing the number of heuristics.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
儒雅龙完成签到 ,获得积分10
刚刚
ZHN完成签到,获得积分10
2秒前
阳光保温杯完成签到 ,获得积分10
3秒前
陈思完成签到,获得积分10
4秒前
科研通AI2S应助wise111采纳,获得10
11秒前
Wk发布了新的文献求助10
12秒前
SharonDu完成签到 ,获得积分10
13秒前
慕容飞凤完成签到,获得积分10
16秒前
谢尔顿完成签到,获得积分10
16秒前
诺亚方舟哇哈哈完成签到 ,获得积分0
18秒前
Xzmmmm完成签到,获得积分10
20秒前
敏感的咖啡豆完成签到 ,获得积分10
20秒前
21秒前
黎明完成签到,获得积分10
22秒前
落叶捎来讯息完成签到 ,获得积分10
23秒前
shenwei完成签到 ,获得积分10
26秒前
27秒前
zip完成签到,获得积分10
28秒前
加油加油完成签到 ,获得积分10
31秒前
健忘的飞雪完成签到,获得积分10
31秒前
32秒前
咖啡博士完成签到 ,获得积分10
33秒前
爆米花应助球球了采纳,获得10
34秒前
fanlin完成签到,获得积分0
38秒前
舒适的平蓝完成签到,获得积分10
38秒前
ss发布了新的文献求助10
40秒前
橘络完成签到 ,获得积分10
40秒前
啊娴仔完成签到,获得积分10
41秒前
啊啊完成签到,获得积分10
41秒前
大巧若拙完成签到,获得积分10
43秒前
一见憘完成签到 ,获得积分10
45秒前
白竹完成签到 ,获得积分10
48秒前
szh123完成签到 ,获得积分10
48秒前
49秒前
虚心念桃完成签到,获得积分10
51秒前
52秒前
001发布了新的文献求助10
56秒前
hdc12138完成签到,获得积分10
57秒前
58秒前
大明完成签到 ,获得积分10
59秒前
高分求助中
Applied Survey Data Analysis (第三版, 2025) 800
Narcissistic Personality Disorder 700
Assessing and Diagnosing Young Children with Neurodevelopmental Disorders (2nd Edition) 700
The Elgar Companion to Consumer Behaviour and the Sustainable Development Goals 540
Images that translate 500
Transnational East Asian Studies 400
Mapping the Stars: Celebrity, Metonymy, and the Networked Politics of Identity 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3843318
求助须知:如何正确求助?哪些是违规求助? 3385619
关于积分的说明 10540993
捐赠科研通 3106205
什么是DOI,文献DOI怎么找? 1710900
邀请新用户注册赠送积分活动 823851
科研通“疑难数据库(出版商)”最低求助积分说明 774308