亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

An online reinforcement learning approach to charging and order-dispatching optimization for an e-hailing electric vehicle fleet

强化学习 马尔可夫决策过程 计算机科学 动态规划 启发式 收入 运筹学 数学优化 弹道 工作量 车队管理 电动汽车 随机规划 马尔可夫过程 总收入 订单(交换) 匹配(统计) 人工智能 工程类 功率(物理) 经济 数学 物理 财务 量子力学 电信 统计 会计 算法 天文 操作系统
作者
Pengyu Yan,Kaize Yu,Xiuli Chao,Zhibin Chen
出处
期刊:European Journal of Operational Research [Elsevier]
卷期号:310 (3): 1218-1233 被引量:4
标识
DOI:10.1016/j.ejor.2023.03.039
摘要

Given the uncertainty of orders and the dynamically changing workload of charging stations, how to dispatch and charge electric vehicle (EV) fleets becomes a significant challenge facing e-hailing platforms. The common practice is to dispatch EVs to serve orders by heuristic matching methods but enable EV drivers to independently make charging decisions based on their experiences, which may compromise the platform's performance. This study proposes a Markov decision process to jointly optimize the charging and order-dispatching schemes for an e-hailing EV fleet, which provides pick-up services for passengers only from a designated transportation hub (i.e., no pick-up from different locations). The objective is to maximize the total revenue of the fleet throughout a finite horizon. The complete state transition equations of the EV fleet are formulated to track the state-of-charge of their batteries. To learn the charging and order-dispatching policy in a dynamic stochastic environment, an online approximation algorithm is developed, which integrates the model-based reinforcement learning (RL) framework with a novel SARSA(Δ)-sample average approximation (SAA) architecture. Compared with the model-free RL algorithm and approximation dynamic programming (ADP), our algorithm explores high-quality decisions by an SAA model with empirical state transitions and exploits the best decisions so far by an SARSA(Δ) sample-trajectory updating. Computational results based on a real case show that, compared with the existing heuristic method and the ADP in the literature, the proposed approach increases the daily revenue by an average of 31.76% and 14.22%, respectively.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
大幅提高文件上传限制,最高150M (2024-4-1)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
大模型应助科研通管家采纳,获得10
55秒前
55秒前
rofsc完成签到 ,获得积分10
56秒前
852应助健壮的梦之采纳,获得10
1分钟前
ZHURUI完成签到,获得积分10
1分钟前
东方天奇完成签到 ,获得积分10
1分钟前
tm_skywoodlin完成签到,获得积分0
1分钟前
ZZY发布了新的文献求助10
1分钟前
1分钟前
健壮的梦之完成签到,获得积分10
1分钟前
爆米花应助ZZY采纳,获得10
2分钟前
2分钟前
勺子爱西瓜完成签到,获得积分10
2分钟前
风趣的茹嫣完成签到 ,获得积分10
2分钟前
lyyzxx完成签到 ,获得积分10
2分钟前
2分钟前
4分钟前
4分钟前
4分钟前
大气山柏发布了新的文献求助10
5分钟前
5分钟前
滾滾完成签到,获得积分10
5分钟前
ZZY发布了新的文献求助10
5分钟前
隐形曼青应助ZZY采纳,获得30
5分钟前
5分钟前
汉堡包应助刘珊妹采纳,获得10
6分钟前
6分钟前
6分钟前
轻松的芯完成签到 ,获得积分10
6分钟前
烟花应助持卿采纳,获得100
6分钟前
简一完成签到 ,获得积分10
6分钟前
konosuba完成签到,获得积分10
6分钟前
苏鱼完成签到 ,获得积分10
6分钟前
6分钟前
螃蟹应助科研通管家采纳,获得20
6分钟前
SciGPT应助科研通管家采纳,获得10
6分钟前
6分钟前
wanci应助持卿采纳,获得10
7分钟前
JOJO完成签到,获得积分10
7分钟前
7分钟前
高分求助中
Formgebungs- und Stabilisierungsparameter für das Konstruktionsverfahren der FiDU-Freien Innendruckumformung von Blech 1000
The Illustrated History of Gymnastics 800
The Bourse of Babylon : market quotations in the astronomical diaries of Babylonia 680
Division and square root. Digit-recurrence algorithms and implementations 500
Hypofractionated Stereotactic Radiosurgery for Brain Metastases 390
The role of a multidrug-resistance gene (lemdrl) in conferring vinblastine resistance in Leishmania enriettii 330
Elgar Encyclopedia of Consumer Behavior 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 有机化学 工程类 生物化学 纳米技术 物理 内科学 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 电极 光电子学 量子力学
热门帖子
关注 科研通微信公众号,转发送积分 2509588
求助须知:如何正确求助?哪些是违规求助? 2159824
关于积分的说明 5529725
捐赠科研通 1880018
什么是DOI,文献DOI怎么找? 935596
版权声明 564161
科研通“疑难数据库(出版商)”最低求助积分说明 499525