斯塔克伯格竞赛
计算机科学
控制(管理)
马尔可夫决策过程
增强学习
马尔可夫链
纳什均衡
功率(物理)
功率控制
跳跃的
人工智能
马尔可夫过程
数学优化
强化学习
机器学习
数理经济学
数学
统计
物理
生物
量子力学
生理学
作者
Yuzhuo Zhang,Mengzhuo Luo,Jun Cheng,Huaicheng Yan,Kaibo Shi
标识
DOI:10.1016/j.ins.2025.122218
科研通智能强力驱动
Strongly Powered by AbleSci AI