马尔可夫决策过程
计算机科学
钥匙(锁)
决策过程
马尔可夫链
马尔可夫过程
管理科学
运筹学
决策问题
数学优化
决策论
部分可观测马尔可夫决策过程
过程(计算)
马尔可夫模型
机器学习
数学
算法
统计
程序设计语言
计算机安全
经济
作者
Chelsea C. White,Douglas J. White
标识
DOI:10.1016/0377-2217(89)90348-2
摘要
A review is given of an optimization model of discrete-stage, sequential decision making in a stochastic environment, called the Markov decision process (MDP). This review presents an overview of theoretical and computational results, applications, several generalizations of the standard MDP problem formulation, and future directions for research. The reference list contains seminal papers, key texts, and surveys for the interested reader.
科研通智能强力驱动
Strongly Powered by AbleSci AI