Graph Transformer with Reinforcement Learning for Vehicle Routing Problem

启发式 强化学习 计算机科学 编码器 图形 变压器 车辆路径问题 理论计算机科学 人工智能 数学优化 布线(电子设计自动化) 数学 工程类 计算机网络 电压 电气工程 操作系统
作者
Getu Fellek,Ahmed Farid,Goytom Gebreyesus,Shigeru Fujimura,Osamu Yoshie
出处
期刊:Ieej Transactions on Electrical and Electronic Engineering [Wiley]
卷期号:18 (5): 701-713 被引量:13
标识
DOI:10.1002/tee.23771
摘要

Vehicle routing problem (VRP) is one of the classic combinatorial optimization problems where an optimal tour to visit customers is required with a minimum total cost in the presence of some constraints. Recently, VRP is being solved with the use of deep reinforcement learning (DRL), with node sets considered (represented) as a graph structure. Existing Transformer based DRL solutions for VRP rely only on node information ignoring the role of information on the edges between nodes in the graph structure. In this paper, we proposed an attention‐based end‐to‐end DRL model to solve VRP which embeds edge information between nodes for rich graph representation learning. We used Transformer based encoder‐decoder framework with an edge information embedded multi‐head attention (EEMHA) layer in the encoder. The EEMHA‐based encoder learns underlying structure of the graph and generates an expressive graph topology representation by merging node and edge information. We trained our model using proximal policy optimization (PPO) with some code‐level optimization techniques. We conducted an experiment on randomly generated instances and on a real‐world data generated from road networks to verify the performance of our proposed model. The result from all experiments show that our model performs better than the existing DRL methods and most of the conventional heuristics with good generalizability from random instance training to real‐world instance testing of different problem size. © 2023 Institute of Electrical Engineers of Japan. Published by Wiley Periodicals LLC.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
好名字发布了新的文献求助10
1秒前
会飞的蜗牛完成签到,获得积分10
2秒前
2秒前
wanci应助叶叶采纳,获得10
2秒前
2568269431完成签到 ,获得积分10
3秒前
5秒前
贝林7完成签到,获得积分10
5秒前
万有引力发布了新的文献求助10
6秒前
wind发布了新的文献求助10
8秒前
Singularity发布了新的文献求助10
8秒前
可靠谷蓝完成签到 ,获得积分10
10秒前
小7发布了新的文献求助10
11秒前
好名字完成签到,获得积分10
11秒前
12秒前
zjx0925发布了新的文献求助10
13秒前
广州南完成签到 ,获得积分10
14秒前
万有引力完成签到 ,获得积分10
15秒前
文艺小馒头完成签到,获得积分10
17秒前
庄彧完成签到 ,获得积分10
18秒前
不敢装睡完成签到,获得积分10
18秒前
繁荣的忆文完成签到,获得积分10
20秒前
zz完成签到,获得积分10
21秒前
清雨桩完成签到,获得积分10
22秒前
zjx0925完成签到,获得积分10
22秒前
小萌发布了新的文献求助10
22秒前
QQ完成签到,获得积分10
22秒前
AronHUANG完成签到,获得积分10
23秒前
23秒前
loin完成签到,获得积分10
25秒前
lql发布了新的文献求助10
29秒前
jinyu完成签到,获得积分10
30秒前
30秒前
daheeeee完成签到,获得积分10
32秒前
Wecple完成签到 ,获得积分10
33秒前
Ethan完成签到,获得积分10
33秒前
宇文数学完成签到 ,获得积分10
33秒前
酷酷李可爱婕完成签到 ,获得积分10
33秒前
小鳄鱼一只完成签到,获得积分10
33秒前
isonomia完成签到,获得积分10
34秒前
35秒前
高分求助中
Applied Survey Data Analysis (第三版, 2025) 800
Narcissistic Personality Disorder 700
Assessing and Diagnosing Young Children with Neurodevelopmental Disorders (2nd Edition) 700
The Elgar Companion to Consumer Behaviour and the Sustainable Development Goals 540
The Martian climate revisited: atmosphere and environment of a desert planet 500
Images that translate 500
Transnational East Asian Studies 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3843340
求助须知:如何正确求助?哪些是违规求助? 3385634
关于积分的说明 10541427
捐赠科研通 3106276
什么是DOI,文献DOI怎么找? 1710911
邀请新用户注册赠送积分活动 823851
科研通“疑难数据库(出版商)”最低求助积分说明 774313