An efficient learning framework for multiproduct inventory systems with customer choices

后悔 计算机科学 维数之咒 数学优化 采购 对数 时间范围 产品(数学) 库存控制 运营管理 运筹学 人工智能 数学 机器学习 经济 几何学 数学分析
作者
Xiangyu Gao,Huanan Zhang
出处
期刊:Production and Operations Management [Wiley]
卷期号:31 (6): 2492-2516 被引量:4
标识
DOI:10.1111/poms.13693
摘要

We consider a periodic‐review multiproduct inventory system where customers' purchasing decisions are affected by the product availabilities. Demands need to be learned on the fly, through the partial and censored feedback of customers. For this learning problem, if one ignores the inventory dynamic and treats it as a multiarmed bandit problem and directly applies some existing algorithms, for example, the upper confidence bound (UCB) algorithm, the convergence can be extremely slow due to the high‐dimensionality of the policy space. We propose a UCB‐based learning framework that utilizes the sales information based on two improvement ideas. We illustrate how these two ideas can be incorporated by considering two specific systems: (1) multiproduct inventory system with stock‐out substitutions, (2) multiproduct inventory assortment problem for urban warehouses. We develop improved UCB algorithms for both systems, using the two improvements. For both systems, the algorithm can achieve a tight worst‐case convergence rate (up to a logarithmic term) on the planning horizon [Formula: see text]. Extensive numerical experiments are conducted to demonstrate the efficiency of the improved UCB algorithms for the two systems. In the experiments, when there are more than 1000 candidate policies to choose from, the algorithms can achieve around [Formula: see text] average expected regret within 50 periods and continue to steadily improve as time increases.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
筑梦发布了新的文献求助10
1秒前
姚文超完成签到,获得积分10
3秒前
刘鑫宇关注了科研通微信公众号
3秒前
轻声看雨发布了新的文献求助10
3秒前
超帅含双完成签到,获得积分10
4秒前
BYN完成签到 ,获得积分10
4秒前
6秒前
深情安青应助加百莉采纳,获得10
7秒前
9秒前
奋斗平卉完成签到,获得积分10
11秒前
11秒前
英俊的铭应助ricky采纳,获得10
13秒前
2024220513发布了新的文献求助10
15秒前
15秒前
ww完成签到,获得积分10
16秒前
16秒前
温暖的以旋完成签到,获得积分10
17秒前
toto发布了新的文献求助10
18秒前
秀丽的冬瓜完成签到,获得积分20
19秒前
ok123完成签到 ,获得积分10
19秒前
慕青应助微笑的铸海采纳,获得10
19秒前
老黑完成签到,获得积分10
21秒前
昏睡的蟠桃举报风不鸣枝求助涉嫌违规
21秒前
power完成签到,获得积分10
22秒前
缪道之发布了新的文献求助10
22秒前
24秒前
yyzhou完成签到 ,获得积分10
24秒前
25秒前
25秒前
toto完成签到,获得积分10
26秒前
漫漫完成签到 ,获得积分10
26秒前
YQT完成签到 ,获得积分10
27秒前
jfaioe完成签到,获得积分10
28秒前
星野发布了新的文献求助10
29秒前
30秒前
30秒前
cyx发布了新的文献求助10
30秒前
Wunier61发布了新的文献求助10
32秒前
香蕉觅云应助keyantong采纳,获得10
33秒前
xiaoqi666完成签到 ,获得积分10
33秒前
高分求助中
Mass producing individuality 600
Разработка метода ускоренного контроля качества электрохромных устройств 500
A Combined Chronic Toxicity and Carcinogenicity Study of ε-Polylysine in the Rat 400
Advances in Underwater Acoustics, Structural Acoustics, and Computational Methodologies 300
Graphene Quantum Dots (GQDs): Advances in Research and Applications 200
Advanced Introduction to US Civil Liberties 200
Effect of deresuscitation management vs. usual care on ventilator-free days in patients with abdominal septic shock 200
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3825251
求助须知:如何正确求助?哪些是违规求助? 3367521
关于积分的说明 10446344
捐赠科研通 3086892
什么是DOI,文献DOI怎么找? 1698353
邀请新用户注册赠送积分活动 816713
科研通“疑难数据库(出版商)”最低求助积分说明 769937