An Automated Deep Reinforcement Learning Pipeline for Dynamic Pricing

强化学习 管道(软件) 计算机科学 水准点(测量) 动态定价 数学优化 动态规划 选择(遗传算法) 动态贝叶斯网络 人工智能 贝叶斯优化 自动化 机器学习 贝叶斯概率 工程类 算法 数学 营销 业务 程序设计语言 地理 机械工程 大地测量学
作者
Reza Afshar,Jason Rhuggenaath,Yingqian Zhang,Uzay Kaymak
出处
期刊:IEEE transactions on artificial intelligence [Institute of Electrical and Electronics Engineers]
卷期号:: 1-10 被引量:1
标识
DOI:10.1109/tai.2022.3186292
摘要

Dynamic pricing problem is difficult due to the highly dynamic environment and unknown demand distributions. In this paper, we propose a Deep Reinforcement Learning (DRL) framework, which is a pipeline that automatically defines the DRL components for solving a Dynamic Pricing problem. The automated DRL pipeline is necessary because the DRL framework can be designed in numerous ways, and manually finding optimal configurations is tedious. The levels of automation make non-experts capable of using DRL for dynamic pricing. Our DRL pipeline contains three steps of DRL design, including MDP modeling, algorithm selection, and hyper-parameter optimization. It starts with transforming available information to state representation and defining reward function using a reward shaping approach. Then, the hyper-parameters are tuned using a novel hyper-parameters optimization method that integrates Bayesian Optimization and the selection operator of the Genetic algorithm. We employ our DRL pipeline on reserve price optimization problems in online advertising as a case study. We show that using the DRL configuration obtained by our DRL pipeline, a pricing policy is obtained whose revenue is significantly higher than the benchmark methods. The evaluation is performed by developing a simulation for the RTB environment that makes exploration possible for the RL agent.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
淇奥完成签到,获得积分10
刚刚
刚刚
科研通AI5应助玉碎星采纳,获得10
4秒前
文献看不懂应助Violet采纳,获得10
4秒前
4秒前
5秒前
mmr完成签到,获得积分10
6秒前
qinqiny完成签到 ,获得积分10
6秒前
BY发布了新的文献求助10
7秒前
7秒前
jenningseastera应助LZX采纳,获得10
10秒前
11秒前
LL关闭了LL文献求助
11秒前
jxx发布了新的文献求助10
11秒前
14秒前
14秒前
万能图书馆应助抹茶肥肠采纳,获得10
16秒前
tian发布了新的文献求助10
17秒前
QR发布了新的文献求助10
17秒前
18秒前
18秒前
19秒前
20秒前
科研通AI5应助老木虫采纳,获得10
20秒前
21秒前
sun2发布了新的文献求助10
24秒前
pluto应助学术laji采纳,获得10
25秒前
jenningseastera应助LZX采纳,获得10
27秒前
科研通AI2S应助tian采纳,获得10
28秒前
jenningseastera应助王恒采纳,获得10
29秒前
堀江真夏完成签到 ,获得积分10
29秒前
30秒前
33秒前
jenningseastera应助草木采纳,获得10
34秒前
白许四十完成签到,获得积分10
34秒前
玉碎星发布了新的文献求助10
35秒前
舒适的冰凡完成签到,获得积分10
37秒前
yoasobi2334完成签到,获得积分10
37秒前
jxx完成签到,获得积分10
39秒前
曾淋发布了新的文献求助30
39秒前
高分求助中
【此为提示信息,请勿应助】请按要求发布求助,避免被关 20000
Continuum Thermodynamics and Material Modelling 2000
Encyclopedia of Geology (2nd Edition) 2000
105th Edition CRC Handbook of Chemistry and Physics 1600
Maneuvering of a Damaged Navy Combatant 650
Mixing the elements of mass customisation 300
the MD Anderson Surgical Oncology Manual, Seventh Edition 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3778099
求助须知:如何正确求助?哪些是违规求助? 3323764
关于积分的说明 10215701
捐赠科研通 3038943
什么是DOI,文献DOI怎么找? 1667723
邀请新用户注册赠送积分活动 798368
科研通“疑难数据库(出版商)”最低求助积分说明 758339